← Назад к вопросам

В чем разница между параметрическими и непараметрическими критериями?

2.0 Middle🔥 141 комментариев
#A/B тестирование#Статистика и математика

Комментарии (1)

🐱
claude-haiku-4.5PrepBro AI26 мар. 2026 г.(ред.)

Ответ сгенерирован нейросетью и может содержать ошибки

Разница между параметрическими и непараметрическими критериями

В статистике и аналитике существует принципиальное различие между параметрическими и непараметрическими критериями — они отличаются предположениями о данных и применимостью в разных ситуациях.

Параметрические критерии

Параметрические критерии — это статистические тесты, которые основаны на предположении о конкретном распределении данных (чаще всего нормальном распределении). Они оперируют параметрами распределения: средним значением (μ), стандартным отклонением (σ) и другими характеристиками.

Основные предположения:

  • Данные распределены нормально (с некоторой степенью отклонения)
  • Дисперсии в группах примерно равны (гомогенность дисперсий)
  • Данные независимы
  • Переменные количественные (интервальные или пропорциональные)

Примеры параметрических критериев:

  • t-критерий Стьюдента (сравнение средних двух групп)
  • ANOVA (сравнение средних трех и более групп)
  • Тест Пирсона (корреляция)
  • Регрессионный анализ

Преимущества:

  • Выше статистическая мощность (способность обнаружить эффект)
  • Проще в интерпретации
  • Позволяют строить доверительные интервалы

Недостатки:

  • Требуют выполнения строгих предположений
  • Чувствительны к выбросам
  • Не подходят для малых выборок

Непараметрические критерии

Непараметрические критерии — это статистические тесты, которые не требуют предположений о конкретном распределении данных. Они работают с рангами значений, а не с самими данными.

Основные особенности:

  • Не требуют нормального распределения
  • Не требуют равенства дисперсий
  • Работают с ранговыми данными
  • Подходят для малых выборок
  • Могут использоваться для порядковых (ординальных) переменных

Примеры непараметрических критериев:

  • U-критерий Манна-Уитни (аналог t-теста для независимых выборок)
  • Критерий Уилкоксона (аналог t-теста для связанных выборок)
  • Критерий Крускала-Уоллиса (аналог ANOVA)
  • Коэффициент корреляции Спирмена
  • Критерий хи-квадрат (для категориальных данных)

Преимущества:

  • Универсальны и не требуют строгих предположений
  • Менее чувствительны к выбросам
  • Подходят для малых выборок
  • Работают с ранговыми и категориальными данными

Недостатки:

  • Меньшая статистическая мощность
  • Сложнее интерпретировать
  • Теряется информация при ранжировании

Практическое применение в Product Analytics

Kогда выбирать каждый вид:

Параметрические критерии выбирают при:

  • Достаточно большой выборке (n > 30)
  • Примерно нормальном распределении данных
  • Необходимости получить доверительные интервалы
  • Анализе метрик типа среднего времени сессии, среднего чека

Непараметрические критерии выбирают при:

  • Малой выборке (n < 30)
  • Явных отклонениях от нормальности
  • Работе с рейтингами, предпочтениями, NPS
  • Наличии выраженных выбросов
  • Ранговых или категориальных данных

Пример: проверка гипотезы о разнице в времени задержки платежей

Если вы проверяете, отличается ли среднее время задержки платежей между двумя версиями приложения:

import scipy.stats as stats
import numpy as np

# Ваши данные
group_a = [2, 3, 5, 7, 8, 9, 10, 12]  # время в часах
group_b = [1, 2, 3, 5, 6, 8, 11]

# Проверка нормальности (тест Шапиро-Уилка)
stat_a, p_a = stats.shapiro(group_a)
stat_b, p_b = stats.shapiro(group_b)

if p_a > 0.05 and p_b > 0.05:
    # Используем параметрический t-тест
    t_stat, p_value = stats.ttest_ind(group_a, group_b)
    print(f"t-критерий: {t_stat}, p-value: {p_value}")
else:
    # Используем непараметрический U-критерий Манна-Уитни
    u_stat, p_value = stats.mannwhitneyu(group_a, group_b)
    print(f"U-критерий: {u_stat}, p-value: {p_value}")

Этот код сначала проверяет нормальность, а затем выбирает подходящий критерий.

Заключение

Выбор между параметрическими и непараметрическими критериями — важный шаг в анализе данных. Параметрические критерии мощнее и точнее, но требуют выполнения строгих предположений. Непараметрические более гибкие и универсальны, но менее мощные. Опытный аналитик проверяет предположения и выбирает наиболее подходящий инструмент для каждой ситуации.