Инфраструктурные требования Instagram для пиковых нагрузок

Question

## Условие

Вы Technical Product Manager в Instagram. Необходимо спланировать инфраструктуру для обработки пиковых нагрузок (New Year, Super Bowl, крупные события).

## Задание

1. Оцените масштаб нагрузки:
   - Сколько пользователей одновременно?
   - Сколько фото/видео загружается в пик?
   - Какой трафик это генерирует?
2. Определите требования к инфраструктуре:
   - Серверы
   - Хранилище
   - CDN
   - База данных
3. Как обеспечить масштабирование?
4. Какие trade-offs нужно учитывать (стоимость vs надёжность)?
5. Как тестировать готовность к пиковым нагрузкам?

claude-haiku-4.5 · Accepted Answer

## Инфраструктурные требования Instagram для пиковых нагрузок

### 1. Масштаб нагрузки

**Instagram базовые данные (2024):**
- DAU: 500M
- MAU: 2B+
- Пиковая одновременная нагрузка: 1.2-1.5B (New Year, Super Bowl)
- Усиление фактор: 2-10x vs обычный день

**Пиковые события:**
- New Year: 1.5B одновременно (2-3x)
- Super Bowl: 400-500M (3-5x)
- Celebrity news: 500M за 1 час (5-10x)

### 2. Детальные расчёты

**Concurrent users: 500M**

**Трафик:**
- Feed/Reels: 200M users, 5 posts, 1 MB = 1 EB, 55K req/sec
- Stories upload: 75M users, 7 MB = 525 TB, 20K uploads/sec
- Comments/Likes: 100M users, 2B interactions/hour, 555K writes/sec
- Video upload: 5M videos, 200 MB = 1 PB, 1.4K uploads/sec

**Итоговые метрики:**
- Download: 1 EB
- Upload: 1.5 PB
- Throughput: 200 Gbps
- API: 55K reads + 20K uploads + 555K DB writes/sec

### 3. Инфраструктура

**Compute:**
- API Servers: 1M base + 300K-500K peak, Cost: $150-500M
- Load Balancers: 10K-20K, Cost: $15-75M
- App Tier: 500K-1M контейнеров, Cost: $200-400M

**Storage:**
- Hot: 10-50 PB SSD, Cost: $100-500M
- Cache: 5-10 PB RAM, Cost: $500M-1B
- Object: 2.5 EB total, Cost: $57B (амортизировано)

**Network:**
- CDN: 500+ PoP, 200 Gbps/region, Cost: $1-5B
- Backbone: 1000 Tbps, Cost: $100M-1B

**Database:**
- SQL: 10K-50K nodes, Cost: $200-400M
- NoSQL: 50K-100K nodes, Cost: $500M-1B
- Cache: 1000-5000 nodes, Cost: $100-200M

### 4. Масштабирование

**Horizontal:**
- Auto-scaling (CPU >70%, Latency >500ms)
- 100K серверов за 5-10 минут
- Regional load balancing

**Graceful degradation (при 2-3x нагрузке):**
- Отключить recommendations
- Приоритеты: Feed → Stories → Comments → Reels
- Cached контент (1-2 часа старый)

**Caching:**
- Browser: 1 день
- CDN: 6 часов
- Redis: 1 час
- DB: 10 минут
- Goal: снизить origin load на 80%

### 5. Trade-offs

**Сценарий 1: Максимальная надёжность**
- Cost: $500B-1T (нереально)
- Uptime: 99.999%

**Сценарий 2: Умное масштабирование (RECOMMENDED)**
- Cost: $5-10B годово
- Uptime: 99.95%
- Meta выбирает этот вариант

**Сценарий 3: Минимальная стоимость**
- Cost: $1-2B
- Uptime: 95% (risk: полный отказ)

### 6. Тестирование

**Load Testing:**
- Locust/JMeter: 1M-100M users, 6 часов
- Ramping: 0 → 500M за 30 минут
- Cost: $1M

**Chaos Engineering:**
- Убивать случайные серверы
- Network latency/packet loss
- Database failover тестирование

**Real-world:**
- Beta: 1% → 5% → 50% → 100%
- Synthetic monitoring 24/7
- Game days (месячные драки)

**Мониторинг:**
- Latency (p99): Normal 50ms → Peak 200ms → Alert 500ms
- Error rate: 0.01% → 0.1% → Alert 1%
- CPU: 40% → 80% → Alert 90%
- Network: 50 Gbps → 150 Gbps → Alert 180 Gbps

### Итоговая стратегия

**Для 1.5B одновременных пользователей:**
1. Compute: 1M + 300K-500K peak ($500M-1B)
2. Storage: 10-50 PB hot, 2.5 EB total ($5-10B)
3. Database: 50K-100K nodes ($500M-1B)
4. Network: 500+ PoP, 1000 Tbps backbone ($1-5B)
5. **Total: $5-10B/год ($2.50 per user/year)**

**Результат: 99.95% uptime, sub-500ms latency, graceful degradation**

Инфраструктурные требования Instagram для пиковых нагрузок

Условие

Задание

Комментарии (1)

Инфраструктурные требования Instagram для пиковых нагрузок

1. Масштаб нагрузки

2. Детальные расчёты

3. Инфраструктура

4. Масштабирование

5. Trade-offs

6. Тестирование

Итоговая стратегия

Похожие вопросы