← Назад к вопросам
Инфраструктурные требования Instagram для пиковых нагрузок
3.0 Senior🔥 81 комментариев
#Бизнес и стратегия#Методологии разработки
Условие
Вы Technical Product Manager в Instagram. Необходимо спланировать инфраструктуру для обработки пиковых нагрузок (New Year, Super Bowl, крупные события).
Задание
- Оцените масштаб нагрузки:
- Сколько пользователей одновременно?
- Сколько фото/видео загружается в пик?
- Какой трафик это генерирует?
- Определите требования к инфраструктуре:
- Серверы
- Хранилище
- CDN
- База данных
- Как обеспечить масштабирование?
- Какие trade-offs нужно учитывать (стоимость vs надёжность)?
- Как тестировать готовность к пиковым нагрузкам?
Комментарии (1)
🐱
claude-haiku-4.5PrepBro AI23 мар. 2026 г.(ред.)
Ответ сгенерирован нейросетью и может содержать ошибки
Инфраструктурные требования Instagram для пиковых нагрузок
1. Масштаб нагрузки
Instagram базовые данные (2024):
- DAU: 500M
- MAU: 2B+
- Пиковая одновременная нагрузка: 1.2-1.5B (New Year, Super Bowl)
- Усиление фактор: 2-10x vs обычный день
Пиковые события:
- New Year: 1.5B одновременно (2-3x)
- Super Bowl: 400-500M (3-5x)
- Celebrity news: 500M за 1 час (5-10x)
2. Детальные расчёты
Concurrent users: 500M
Трафик:
- Feed/Reels: 200M users, 5 posts, 1 MB = 1 EB, 55K req/sec
- Stories upload: 75M users, 7 MB = 525 TB, 20K uploads/sec
- Comments/Likes: 100M users, 2B interactions/hour, 555K writes/sec
- Video upload: 5M videos, 200 MB = 1 PB, 1.4K uploads/sec
Итоговые метрики:
- Download: 1 EB
- Upload: 1.5 PB
- Throughput: 200 Gbps
- API: 55K reads + 20K uploads + 555K DB writes/sec
3. Инфраструктура
Compute:
- API Servers: 1M base + 300K-500K peak, Cost: $150-500M
- Load Balancers: 10K-20K, Cost: $15-75M
- App Tier: 500K-1M контейнеров, Cost: $200-400M
Storage:
- Hot: 10-50 PB SSD, Cost: $100-500M
- Cache: 5-10 PB RAM, Cost: $500M-1B
- Object: 2.5 EB total, Cost: $57B (амортизировано)
Network:
- CDN: 500+ PoP, 200 Gbps/region, Cost: $1-5B
- Backbone: 1000 Tbps, Cost: $100M-1B
Database:
- SQL: 10K-50K nodes, Cost: $200-400M
- NoSQL: 50K-100K nodes, Cost: $500M-1B
- Cache: 1000-5000 nodes, Cost: $100-200M
4. Масштабирование
Horizontal:
- Auto-scaling (CPU >70%, Latency >500ms)
- 100K серверов за 5-10 минут
- Regional load balancing
Graceful degradation (при 2-3x нагрузке):
- Отключить recommendations
- Приоритеты: Feed → Stories → Comments → Reels
- Cached контент (1-2 часа старый)
Caching:
- Browser: 1 день
- CDN: 6 часов
- Redis: 1 час
- DB: 10 минут
- Goal: снизить origin load на 80%
5. Trade-offs
Сценарий 1: Максимальная надёжность
- Cost: $500B-1T (нереально)
- Uptime: 99.999%
Сценарий 2: Умное масштабирование (RECOMMENDED)
- Cost: $5-10B годово
- Uptime: 99.95%
- Meta выбирает этот вариант
Сценарий 3: Минимальная стоимость
- Cost: $1-2B
- Uptime: 95% (risk: полный отказ)
6. Тестирование
Load Testing:
- Locust/JMeter: 1M-100M users, 6 часов
- Ramping: 0 → 500M за 30 минут
- Cost: $1M
Chaos Engineering:
- Убивать случайные серверы
- Network latency/packet loss
- Database failover тестирование
Real-world:
- Beta: 1% → 5% → 50% → 100%
- Synthetic monitoring 24/7
- Game days (месячные драки)
Мониторинг:
- Latency (p99): Normal 50ms → Peak 200ms → Alert 500ms
- Error rate: 0.01% → 0.1% → Alert 1%
- CPU: 40% → 80% → Alert 90%
- Network: 50 Gbps → 150 Gbps → Alert 180 Gbps
Итоговая стратегия
Для 1.5B одновременных пользователей:
- Compute: 1M + 300K-500K peak ($500M-1B)
- Storage: 10-50 PB hot, 2.5 EB total ($5-10B)
- Database: 50K-100K nodes ($500M-1B)
- Network: 500+ PoP, 1000 Tbps backbone ($1-5B)
- Total: $5-10B/год ($2.50 per user/year)
Результат: 99.95% uptime, sub-500ms latency, graceful degradation