По какому принципу расставляются ранги в тесте Манна-Уитни
Комментарии (2)
Ответ сгенерирован нейросетью и может содержать ошибки
По какому принципу расставляются ранги в тесте Манна-Уитни
Тест Манна-Уитни (Mann-Whitney U test) - это непараметрический статистический тест для сравнения двух независимых групп. Ранги - ключевая часть этого теста.
Что такое ранги
Ранги - это позиции значений в упорядоченном списке. Вместо работы с абсолютными значениями, тест Манна-Уитни работает с их порядковыми номерами.
Принцип расставления рангов
Шаг 1: Объединение данных
- Объединяешь все наблюдения из обеих групп в один список
- Пример: Группа A: [3, 7, 5], Группа B: [2, 8, 6]
- Объединённый список: [2, 3, 5, 6, 7, 8]
Шаг 2: Сортировка по возрастанию
- Сортируешь в порядке от меньшего к большему
- Это уже сделано выше
Шаг 3: Присвоение рангов
- Каждому значению присваиваешь его позицию в отсортированном списке
- 2 (из B) = ранг 1
- 3 (из A) = ранг 2
- 5 (из A) = ранг 3
- 6 (из B) = ранг 4
- 7 (из A) = ранг 5
- 8 (из B) = ранг 6
Шаг 4: Обработка связанных значений (ties)
- Если два значения одинаковые, они получают средний ранг
- Пример: если есть [2, 3, 3, 5]
- Ранги: 1, 2.5, 2.5, 4 (вместо 1, 2, 3, 4)
- Объяснение: два значения 3 занимают позиции 2 и 3, поэтому берём (2+3)/2 = 2.5
Пример полный
Группа A (A/B тест - контроль): [10, 15, 12] Группа B (A/B тест - вариант): [18, 11, 20, 14]
Объединённый отсортированный: [10, 11, 12, 14, 15, 18, 20]
Присвоение рангов:
- 10 (A) = ранг 1
- 11 (B) = ранг 2
- 12 (A) = ранг 3
- 14 (B) = ранг 4
- 15 (A) = ранг 5
- 18 (B) = ранг 6
- 20 (B) = ранг 7
Сумма рангов:
- Группа A: 1 + 3 + 5 = 9
- Группа B: 2 + 4 + 6 + 7 = 19
Зачем ранги нужны
Непараметричность:
- Mann-Whitney не требует нормального распределения
- Работает с любыми распределениями
- Ранги превращают данные в относительные позиции
Робастность:
- Выбросы не влияют сильно
- Пример: [1, 2, 1000] имеет ранги [1, 2, 3], а не [1, 2, 1000]
- Это делает тест менее чувствительным к экстремальным значениям
Сравнение групп:
- Если группа B имеет более высокие ранги, значит её значения больше
- U-статистика вычисляется из разницы сумм рангов
Вычисление U-статистики
U1 = n1 × n2 + (n1 × (n1 + 1)) / 2 - R1
Где:
- n1 = размер первой группы
- n2 = размер второй группы
- R1 = сумма рангов первой группы
На нашем примере:
- U_A = 3 × 4 + (3 × 4) / 2 - 9 = 12 + 6 - 9 = 9
Типичные случаи в PM практике
A/B тестирование:
- Группа A (контроль): время на странице
- Группа B (новый дизайн): время на странице
- Данные не нормально распределены (много outliers)
- Используешь Mann-Whitney для проверки, есть ли difference
Сравнение retention:
- Новые пользователи vs опытные
- Платящие vs бесплатные
- Если распределение странное, Mann-Whitney надёжнее t-теста
Типичные ошибки
Путать ранги с самими значениями
Забыть о связанных значениях (ties)
Использовать параметрический тест на непараметрических данных
Неправильно интерпретировать U-статистику
Когда использовать Mann-Whitney
- Данные не нормально распределены
- Есть выбросы
- Размер выборки маленький
- Сравниваешь ранги, а не средние
- Порядковые данные (ratings, satisfaction scores)
Для PM это полезно когда анализируешь A/B тесты с неправильным распределением данных или сравниваешь поведение разных сегментов пользователей.