← Назад к вопросам

Что такое метрика доступности?

2.0 Middle🔥 141 комментариев
#Метрики и аналитика

Комментарии (1)

🐱
claude-haiku-4.5PrepBro AI29 мар. 2026 г.(ред.)

Ответ сгенерирован нейросетью и может содержать ошибки

Что такое метрика доступности?

Метрика доступности (Availability) — это показатель, который описывает, насколько долгое время сервис, система или компонент доступен и функционален для пользователей без перебоев. Это одна из критических метрик надёжности (reliability) продукта.

Определение и формула

Доступность обычно выражается в процентах и рассчитывается как:

Доступность = (Время работы / Общее время) × 100%

Или в терминах downtime:

Доступность = 100% - (Время простоя / Общее время) × 100%

Например:

  • 99.0% доступность = ~7.2 часов простоя в месяц
  • 99.5% доступность = ~3.6 часов простоя в месяц
  • 99.9% доступность = ~43 минуты простоя в месяц (часто обозначается как "три девятки")
  • 99.99% доступность = ~4.3 минуты простоя в месяц
  • 99.999% доступность = ~26 секунд простоя в месяц

Основные компоненты доступности

1. Uptime — период, когда система работает корректно

2. Downtime — период, когда система недоступна или работает некорректно:

  • Плановое обслуживание (scheduled maintenance)
  • Непредвиденные отказы (unplanned outages)
  • Деградация сервиса (partial unavailability)

3. Mean Time Between Failures (MTBF) — среднее время между сбоями

4. Mean Time To Recovery (MTTR) — среднее время восстановления после сбоя

Типы метрик доступности

SLA (Service Level Agreement) — договорное обязательство:

  • Например, провайдер облачных сервисов гарантирует 99.9% доступность
  • Если не достигнута — предусмотрены компенсации

SLO (Service Level Objective) — внутренняя цель компании:

  • Мы хотим достичь 99.95% доступности
  • Это амбициознее, чем обещаемые 99.9%

SLI (Service Level Indicator) — реальный измеренный показатель:

  • Фактическая доступность за месяц = 99.87%

Что влияет на доступность

Инфраструктура:

  • Надёжность серверов и оборудования
  • Отказоустойчивость (redundancy, failover)
  • CDN и geographic distribution
  • Мониторинг и alerting

Процессы:

  • Качество деплойментов
  • Тестирование перед релизом
  • Способность быстро откатить breaking changes
  • Культура incident response

Архитектура:

  • Микросервисы vs монолит (снижение точки отказа)
  • Кэширование
  • Circuit breakers для external services

Почему это важно для PM

Доступность напрямую влияет на пользовательский опыт и доверие:

  • 99.9% доступность — хороший стандарт для большинства SaaS
  • 99.99% доступность — критично для финансовых систем, платежей, телемедицины
  • 95% доступность — допустимо для внутренних tools

Пример из практики

Если сервис платежей имеет 99% доступность, то в день с 10,000 транзакций ~100 транзакций не пройдут. Это потерянные деньги и потеря доверия клиентов. Поэтому такие критичные системы требуют 99.99%+ доступности.

Интересная задача для PM — не просто требовать высокую доступность, а найти баланс между ней и скоростью разработки новых фич.