В чем разница между параметрическими и непараметрическими критериями?

Question

claude-haiku-4.5 · Accepted Answer

## Разница между параметрическими и непараметрическими критериями

В статистике и аналитике существует принципиальное различие между параметрическими и непараметрическими критериями — они отличаются предположениями о данных и применимостью в разных ситуациях.

### Параметрические критерии

**Параметрические критерии** — это статистические тесты, которые основаны на предположении о конкретном распределении данных (чаще всего нормальном распределении). Они оперируют параметрами распределения: средним значением (μ), стандартным отклонением (σ) и другими характеристиками.

Основные предположения:
- Данные распределены нормально (с некоторой степенью отклонения)
- Дисперсии в группах примерно равны (гомогенность дисперсий)
- Данные независимы
- Переменные количественные (интервальные или пропорциональные)

Примеры параметрических критериев:
- t-критерий Стьюдента (сравнение средних двух групп)
- ANOVA (сравнение средних трех и более групп)
- Тест Пирсона (корреляция)
- Регрессионный анализ

**Преимущества:**
- Выше статистическая мощность (способность обнаружить эффект)
- Проще в интерпретации
- Позволяют строить доверительные интервалы

**Недостатки:**
- Требуют выполнения строгих предположений
- Чувствительны к выбросам
- Не подходят для малых выборок

### Непараметрические критерии

**Непараметрические критерии** — это статистические тесты, которые не требуют предположений о конкретном распределении данных. Они работают с рангами значений, а не с самими данными.

Основные особенности:
- Не требуют нормального распределения
- Не требуют равенства дисперсий
- Работают с ранговыми данными
- Подходят для малых выборок
- Могут использоваться для порядковых (ординальных) переменных

Примеры непараметрических критериев:
- U-критерий Манна-Уитни (аналог t-теста для независимых выборок)
- Критерий Уилкоксона (аналог t-теста для связанных выборок)
- Критерий Крускала-Уоллиса (аналог ANOVA)
- Коэффициент корреляции Спирмена
- Критерий хи-квадрат (для категориальных данных)

**Преимущества:**
- Универсальны и не требуют строгих предположений
- Менее чувствительны к выбросам
- Подходят для малых выборок
- Работают с ранговыми и категориальными данными

**Недостатки:**
- Меньшая статистическая мощность
- Сложнее интерпретировать
- Теряется информация при ранжировании

### Практическое применение в Product Analytics

Kогда выбирать каждый вид:

**Параметрические критерии выбирают при:**
- Достаточно большой выборке (n > 30)
- Примерно нормальном распределении данных
- Необходимости получить доверительные интервалы
- Анализе метрик типа среднего времени сессии, среднего чека

**Непараметрические критерии выбирают при:**
- Малой выборке (n < 30)
- Явных отклонениях от нормальности
- Работе с рейтингами, предпочтениями, NPS
- Наличии выраженных выбросов
- Ранговых или категориальных данных

### Пример: проверка гипотезы о разнице в времени задержки платежей

Если вы проверяете, отличается ли среднее время задержки платежей между двумя версиями приложения:

```python
import scipy.stats as stats
import numpy as np

# Ваши данные
group_a = [2, 3, 5, 7, 8, 9, 10, 12]  # время в часах
group_b = [1, 2, 3, 5, 6, 8, 11]

# Проверка нормальности (тест Шапиро-Уилка)
stat_a, p_a = stats.shapiro(group_a)
stat_b, p_b = stats.shapiro(group_b)

if p_a > 0.05 and p_b > 0.05:
    # Используем параметрический t-тест
    t_stat, p_value = stats.ttest_ind(group_a, group_b)
    print(f"t-критерий: {t_stat}, p-value: {p_value}")
else:
    # Используем непараметрический U-критерий Манна-Уитни
    u_stat, p_value = stats.mannwhitneyu(group_a, group_b)
    print(f"U-критерий: {u_stat}, p-value: {p_value}")
```

Этот код сначала проверяет нормальность, а затем выбирает подходящий критерий.

### Заключение

Выбор между параметрическими и непараметрическими критериями — важный шаг в анализе данных. Параметрические критерии мощнее и точнее, но требуют выполнения строгих предположений. Непараметрические более гибкие и универсальны, но менее мощные. Опытный аналитик проверяет предположения и выбирает наиболее подходящий инструмент для каждой ситуации.

В чем разница между параметрическими и непараметрическими критериями?

Комментарии (1)

Разница между параметрическими и непараметрическими критериями

Параметрические критерии

Непараметрические критерии

Практическое применение в Product Analytics

Пример: проверка гипотезы о разнице в времени задержки платежей

Заключение