← Назад к вопросам

Инфраструктурные требования Instagram для пиковых нагрузок

3.0 Senior🔥 81 комментариев
#Бизнес и стратегия#Методологии разработки

Условие

Вы Technical Product Manager в Instagram. Необходимо спланировать инфраструктуру для обработки пиковых нагрузок (New Year, Super Bowl, крупные события).

Задание

  1. Оцените масштаб нагрузки:
    • Сколько пользователей одновременно?
    • Сколько фото/видео загружается в пик?
    • Какой трафик это генерирует?
  2. Определите требования к инфраструктуре:
    • Серверы
    • Хранилище
    • CDN
    • База данных
  3. Как обеспечить масштабирование?
  4. Какие trade-offs нужно учитывать (стоимость vs надёжность)?
  5. Как тестировать готовность к пиковым нагрузкам?

Комментарии (1)

🐱
claude-haiku-4.5PrepBro AI23 мар. 2026 г.(ред.)

Ответ сгенерирован нейросетью и может содержать ошибки

Инфраструктурные требования Instagram для пиковых нагрузок

1. Масштаб нагрузки

Instagram базовые данные (2024):

  • DAU: 500M
  • MAU: 2B+
  • Пиковая одновременная нагрузка: 1.2-1.5B (New Year, Super Bowl)
  • Усиление фактор: 2-10x vs обычный день

Пиковые события:

  • New Year: 1.5B одновременно (2-3x)
  • Super Bowl: 400-500M (3-5x)
  • Celebrity news: 500M за 1 час (5-10x)

2. Детальные расчёты

Concurrent users: 500M

Трафик:

  • Feed/Reels: 200M users, 5 posts, 1 MB = 1 EB, 55K req/sec
  • Stories upload: 75M users, 7 MB = 525 TB, 20K uploads/sec
  • Comments/Likes: 100M users, 2B interactions/hour, 555K writes/sec
  • Video upload: 5M videos, 200 MB = 1 PB, 1.4K uploads/sec

Итоговые метрики:

  • Download: 1 EB
  • Upload: 1.5 PB
  • Throughput: 200 Gbps
  • API: 55K reads + 20K uploads + 555K DB writes/sec

3. Инфраструктура

Compute:

  • API Servers: 1M base + 300K-500K peak, Cost: $150-500M
  • Load Balancers: 10K-20K, Cost: $15-75M
  • App Tier: 500K-1M контейнеров, Cost: $200-400M

Storage:

  • Hot: 10-50 PB SSD, Cost: $100-500M
  • Cache: 5-10 PB RAM, Cost: $500M-1B
  • Object: 2.5 EB total, Cost: $57B (амортизировано)

Network:

  • CDN: 500+ PoP, 200 Gbps/region, Cost: $1-5B
  • Backbone: 1000 Tbps, Cost: $100M-1B

Database:

  • SQL: 10K-50K nodes, Cost: $200-400M
  • NoSQL: 50K-100K nodes, Cost: $500M-1B
  • Cache: 1000-5000 nodes, Cost: $100-200M

4. Масштабирование

Horizontal:

  • Auto-scaling (CPU >70%, Latency >500ms)
  • 100K серверов за 5-10 минут
  • Regional load balancing

Graceful degradation (при 2-3x нагрузке):

  • Отключить recommendations
  • Приоритеты: Feed → Stories → Comments → Reels
  • Cached контент (1-2 часа старый)

Caching:

  • Browser: 1 день
  • CDN: 6 часов
  • Redis: 1 час
  • DB: 10 минут
  • Goal: снизить origin load на 80%

5. Trade-offs

Сценарий 1: Максимальная надёжность

  • Cost: $500B-1T (нереально)
  • Uptime: 99.999%

Сценарий 2: Умное масштабирование (RECOMMENDED)

  • Cost: $5-10B годово
  • Uptime: 99.95%
  • Meta выбирает этот вариант

Сценарий 3: Минимальная стоимость

  • Cost: $1-2B
  • Uptime: 95% (risk: полный отказ)

6. Тестирование

Load Testing:

  • Locust/JMeter: 1M-100M users, 6 часов
  • Ramping: 0 → 500M за 30 минут
  • Cost: $1M

Chaos Engineering:

  • Убивать случайные серверы
  • Network latency/packet loss
  • Database failover тестирование

Real-world:

  • Beta: 1% → 5% → 50% → 100%
  • Synthetic monitoring 24/7
  • Game days (месячные драки)

Мониторинг:

  • Latency (p99): Normal 50ms → Peak 200ms → Alert 500ms
  • Error rate: 0.01% → 0.1% → Alert 1%
  • CPU: 40% → 80% → Alert 90%
  • Network: 50 Gbps → 150 Gbps → Alert 180 Gbps

Итоговая стратегия

Для 1.5B одновременных пользователей:

  1. Compute: 1M + 300K-500K peak ($500M-1B)
  2. Storage: 10-50 PB hot, 2.5 EB total ($5-10B)
  3. Database: 50K-100K nodes ($500M-1B)
  4. Network: 500+ PoP, 1000 Tbps backbone ($1-5B)
  5. Total: $5-10B/год ($2.50 per user/year)

Результат: 99.95% uptime, sub-500ms latency, graceful degradation