← Назад к вопросам

Метрики бинарной классификации: плюсы и минусы каждой

2.2 Middle🔥 161 комментариев
#Метрики и оценка моделей

Комментарии (1)

🐱
claude-haiku-4.5PrepBro AI30 мар. 2026 г.(ред.)

Ответ сгенерирован нейросетью и может содержать ошибки

Метрики бинарной классификации: полный обзор

Выбор метрики — критический аспект оценки производительности моделей классификации. Разные метрики подходят для разных сценариев и распределений классов.

1. Accuracy (Точность)

Формула: (TP + TN) / (TP + TN + FP + FN)

Плюсы:

  • Интуитивно понятна (доля правильных предсказаний)
  • Легко интерпретировать для несведущих
  • Хорошо работает при сбалансированных классах

Минусы:

  • Неинформативна при дисбалансе классов
  • Может быть высокой даже для бесполезной модели
  • Пример: если 99% данных — класс 0, модель получит 99% accuracy, просто всё классифицируя как 0

2. Precision (Точность предсказаний класса 1)

Формула: TP / (TP + FP)

Доля позитивных предсказаний, которые действительно верны.

Плюсы:

  • Важна, когда ложно-положительные случаи дорогостоящи
  • Примеры: спам-фильтр (false positive = удаление письма), скоринг (false positive = одобрение плохого кредита)
  • Хороша при дисбалансе классов

Минусы:

  • Игнорирует false negatives
  • Может быть высокой при очень консервативных предсказаниях (редко предсказываем класс 1)

3. Recall (Полнота)

Формула: TP / (TP + FN)

Доля позитивных примеров, которые модель правильно обнаружила.

Плюсы:

  • Важна, когда false negatives дорогостоящи
  • Примеры: медицина (пропустить болезнь опасно), безопасность (не обнаружить угрозу критично)
  • Помогает избежать пропусков

Минусы:

  • Может быть легко завышена (предсказываем всё как класс 1)
  • Игнорирует false positives

4. F1-Score

Формула: 2 * (Precision * Recall) / (Precision + Recall)

Гармоническое среднее Precision и Recall.

Плюсы:

  • Баланс между Precision и Recall
  • Хороша при дисбалансе классов
  • Устойчива к манипуляциям (сложнее завысить обе метрики одновременно)

Минусы:

  • Придаёт одинаковый вес обеим ошибкам (не всегда уместно)
  • Не отражает реальную стоимость ошибок

5. ROC-AUC

Показывает: площадь под кривой ROC (True Positive Rate vs False Positive Rate при разных порогах)

Плюсы:

  • Независима от порога классификации
  • Хороша при дисбалансе классов
  • Показывает компромисс между TPR и FPR
  • Интерпретируется как вероятность правильного ранжирования случайной пары

Минусы:

  • Менее интуитивна для объяснения
  • Может быть оптимистична при экстремальном дисбалансе
  • Не показывает абсолютную производительность, только относительное ранжирование

6. PR-AUC (Precision-Recall AUC)

Показывает: площадь под кривой Precision-Recall

Плюсы:

  • Лучше для дисбалансированных данных, чем ROC-AUC
  • Более информативна при редких позитивных примерах
  • Рекомендуется для задач обнаружения аномалий

Минусы:

  • Менее стандартна чем ROC-AUC
  • Сложнее интерпретировать

7. Matthews Correlation Coefficient (MCC)

Формула: (TPTN - FPFN) / sqrt((TP+FP)(TP+FN)(TN+FP)(TN+FN))

Плюсы:

  • Учитывает все четыре компонента confusion matrix
  • Хороша при дисбалансе классов
  • -1 до +1, где 0 = случайный классификатор

Минусы:

  • Менее распространена и знакома
  • Сложнее для интерпретации

Рекомендации по выбору

СценарийМетрикаПричина
Сбалансированные данныеAccuracy, F1Стандартный выбор
Дисбаланс классовF1, PR-AUC, MCCУстойчивы к дисбалансу
False positives дорогостоящиPrecisionСпам, фрод
False negatives критичныRecallМедицина, безопасность
Нужен пороговый выборROC-AUC, PR-AUCНезависимы от порога

Практический совет: Всегда анализируйте confusion matrix и используйте несколько метрик вместе, не полагаясь на одну числу.

Метрики бинарной классификации: плюсы и минусы каждой | PrepBro