Как происходит оценка ошибки?

Question

claude-haiku-4.5 · Accepted Answer

## Оценка ошибки в машинном обучении

Оценка ошибки — это процесс измерения качества работы модели путём сравнения её предсказаний с реальными значениями. Ошибка показывает, насколько хорошо модель обучилась и как она будет работать на новых данных.

### Классификация подходов к оценке

#### 1. Метрики для регрессии

Для задач предсказания непрерывных значений используются:

**Mean Absolute Error (MAE)**
```python
from sklearn.metrics import mean_absolute_error
mae = mean_absolute_error(y_true, y_pred)
# Среднее абсолютное отклонение: (1/n) * sum(|y_true - y_pred|)
```

**Mean Squared Error (MSE)**
```python
from sklearn.metrics import mean_squared_error
mse = mean_squared_error(y_true, y_pred)
# Среднеквадратическая ошибка: (1/n) * sum((y_true - y_pred)^2)
# Штрафует большие ошибки сильнее
```

**Root Mean Squared Error (RMSE)**
```python
import numpy as np
rmse = np.sqrt(mean_squared_error(y_true, y_pred))
# Корень из MSE, в тех же единицах, что и y
```

**R-squared (R²)**
```python
from sklearn.metrics import r2_score
r2 = r2_score(y_true, y_pred)
# Доля дисперсии, объяснённая моделью: от 0 до 1
```

#### 2. Метрики для классификации

**Accuracy**
```python
from sklearn.metrics import accuracy_score
acc = accuracy_score(y_true, y_pred)
# (TP + TN) / (TP + TN + FP + FN)
# Не подходит для несбалансированных данных
```

**Precision и Recall**
```python
from sklearn.metrics import precision_score, recall_score
precision = precision_score(y_true, y_pred)  # TP / (TP + FP)
recall = recall_score(y_true, y_pred)       # TP / (TP + FN)
```

**F1-score**
```python
from sklearn.metrics import f1_score
f1 = f1_score(y_true, y_pred)
# Среднее гармоническое Precision и Recall
```

**Confusion Matrix**
```python
from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_true, y_pred)
# Таблица: TP, TN, FP, FN для анализа ошибок
```

### Валидация моделей

**Cross-Validation**
```python
from sklearn.model_selection import cross_val_score
scores = cross_val_score(model, X, y, cv=5, scoring='accuracy')
print(f"Mean: {scores.mean()}, Std: {scores.std()}")
# Разбивает данные на 5 фолдов и оценивает на каждом
```

**Train/Test Split**
```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# 80% на обучение, 20% на тестирование
```

### ROC-кривая и AUC

```python
from sklearn.metrics import roc_curve, auc
fpr, tpr, _ = roc_curve(y_true, y_scores)
roc_auc = auc(fpr, tpr)
# Показывает trade-off между True Positive Rate и False Positive Rate
```

### Практический пример

```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report

model = RandomForestClassifier()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

print(classification_report(y_test, y_pred))
# Выводит Precision, Recall, F1 для каждого класса
```

### Ключевые принципы

- **Выбор метрики зависит от задачи**: для несбалансированных данных используй F1-score, для регрессии — RMSE
- **Никогда не оценивай на тренировочных данных** — это переобучение
- **Используй кросс-валидацию** для надежной оценки на малых датасетах
- **Анализируй ошибки**, а не только метрики — смотри на confusion matrix и ROC-кривую

Правильная оценка ошибки — основа для построения надежных ML-систем в production.

Как происходит оценка ошибки?

Комментарии (1)

Оценка ошибки в машинном обучении

Классификация подходов к оценке

1. Метрики для регрессии

2. Метрики для классификации

Валидация моделей

ROC-кривая и AUC

Практический пример

Ключевые принципы