Комментарии (1)
Ответ сгенерирован нейросетью и может содержать ошибки
Что такое метрика доступности?
Метрика доступности (Availability) — это показатель, который описывает, насколько долгое время сервис, система или компонент доступен и функционален для пользователей без перебоев. Это одна из критических метрик надёжности (reliability) продукта.
Определение и формула
Доступность обычно выражается в процентах и рассчитывается как:
Доступность = (Время работы / Общее время) × 100%
Или в терминах downtime:
Доступность = 100% - (Время простоя / Общее время) × 100%
Например:
- 99.0% доступность = ~7.2 часов простоя в месяц
- 99.5% доступность = ~3.6 часов простоя в месяц
- 99.9% доступность = ~43 минуты простоя в месяц (часто обозначается как "три девятки")
- 99.99% доступность = ~4.3 минуты простоя в месяц
- 99.999% доступность = ~26 секунд простоя в месяц
Основные компоненты доступности
1. Uptime — период, когда система работает корректно
2. Downtime — период, когда система недоступна или работает некорректно:
- Плановое обслуживание (scheduled maintenance)
- Непредвиденные отказы (unplanned outages)
- Деградация сервиса (partial unavailability)
3. Mean Time Between Failures (MTBF) — среднее время между сбоями
4. Mean Time To Recovery (MTTR) — среднее время восстановления после сбоя
Типы метрик доступности
SLA (Service Level Agreement) — договорное обязательство:
- Например, провайдер облачных сервисов гарантирует 99.9% доступность
- Если не достигнута — предусмотрены компенсации
SLO (Service Level Objective) — внутренняя цель компании:
- Мы хотим достичь 99.95% доступности
- Это амбициознее, чем обещаемые 99.9%
SLI (Service Level Indicator) — реальный измеренный показатель:
- Фактическая доступность за месяц = 99.87%
Что влияет на доступность
Инфраструктура:
- Надёжность серверов и оборудования
- Отказоустойчивость (redundancy, failover)
- CDN и geographic distribution
- Мониторинг и alerting
Процессы:
- Качество деплойментов
- Тестирование перед релизом
- Способность быстро откатить breaking changes
- Культура incident response
Архитектура:
- Микросервисы vs монолит (снижение точки отказа)
- Кэширование
- Circuit breakers для external services
Почему это важно для PM
Доступность напрямую влияет на пользовательский опыт и доверие:
- 99.9% доступность — хороший стандарт для большинства SaaS
- 99.99% доступность — критично для финансовых систем, платежей, телемедицины
- 95% доступность — допустимо для внутренних tools
Пример из практики
Если сервис платежей имеет 99% доступность, то в день с 10,000 транзакций ~100 транзакций не пройдут. Это потерянные деньги и потеря доверия клиентов. Поэтому такие критичные системы требуют 99.99%+ доступности.
Интересная задача для PM — не просто требовать высокую доступность, а найти баланс между ней и скоростью разработки новых фич.