По какому принципу расставляются ранги в тесте Манна-Уитни

Question

claude-haiku-4.5 · Accepted Answer

## По какому принципу расставляются ранги в тесте Манна-Уитни

Тест Манна-Уитни (Mann-Whitney U test) - это непараметрический статистический тест для сравнения двух независимых групп. Ранги - ключевая часть этого теста.

### Что такое ранги

Ранги - это позиции значений в упорядоченном списке. Вместо работы с абсолютными значениями, тест Манна-Уитни работает с их порядковыми номерами.

### Принцип расставления рангов

**Шаг 1: Объединение данных**
- Объединяешь все наблюдения из обеих групп в один список
- Пример: Группа A: [3, 7, 5], Группа B: [2, 8, 6]
- Объединённый список: [2, 3, 5, 6, 7, 8]

**Шаг 2: Сортировка по возрастанию**
- Сортируешь в порядке от меньшего к большему
- Это уже сделано выше

**Шаг 3: Присвоение рангов**
- Каждому значению присваиваешь его позицию в отсортированном списке
- 2 (из B) = ранг 1
- 3 (из A) = ранг 2
- 5 (из A) = ранг 3
- 6 (из B) = ранг 4
- 7 (из A) = ранг 5
- 8 (из B) = ранг 6

**Шаг 4: Обработка связанных значений (ties)**
- Если два значения одинаковые, они получают средний ранг
- Пример: если есть [2, 3, 3, 5]
- Ранги: 1, 2.5, 2.5, 4 (вместо 1, 2, 3, 4)
- Объяснение: два значения 3 занимают позиции 2 и 3, поэтому берём (2+3)/2 = 2.5

### Пример полный

**Группа A (A/B тест - контроль):** [10, 15, 12]
**Группа B (A/B тест - вариант):** [18, 11, 20, 14]

**Объединённый отсортированный:** [10, 11, 12, 14, 15, 18, 20]

**Присвоение рангов:**
- 10 (A) = ранг 1
- 11 (B) = ранг 2
- 12 (A) = ранг 3
- 14 (B) = ранг 4
- 15 (A) = ранг 5
- 18 (B) = ранг 6
- 20 (B) = ранг 7

**Сумма рангов:**
- Группа A: 1 + 3 + 5 = 9
- Группа B: 2 + 4 + 6 + 7 = 19

### Зачем ранги нужны

**Непараметричность:**
- Mann-Whitney не требует нормального распределения
- Работает с любыми распределениями
- Ранги превращают данные в относительные позиции

**Робастность:**
- Выбросы не влияют сильно
- Пример: [1, 2, 1000] имеет ранги [1, 2, 3], а не [1, 2, 1000]
- Это делает тест менее чувствительным к экстремальным значениям

**Сравнение групп:**
- Если группа B имеет более высокие ранги, значит её значения больше
- U-статистика вычисляется из разницы сумм рангов

### Вычисление U-статистики

U1 = n1 × n2 + (n1 × (n1 + 1)) / 2 - R1

Где:
- n1 = размер первой группы
- n2 = размер второй группы
- R1 = сумма рангов первой группы

**На нашем примере:**
- U_A = 3 × 4 + (3 × 4) / 2 - 9 = 12 + 6 - 9 = 9

### Типичные случаи в PM практике

**A/B тестирование:**
- Группа A (контроль): время на странице
- Группа B (новый дизайн): время на странице
- Данные не нормально распределены (много outliers)
- Используешь Mann-Whitney для проверки, есть ли difference

**Сравнение retention:**
- Новые пользователи vs опытные
- Платящие vs бесплатные
- Если распределение странное, Mann-Whitney надёжнее t-теста

### Типичные ошибки

Путать ранги с самими значениями

Забыть о связанных значениях (ties)

Использовать параметрический тест на непараметрических данных

Неправильно интерпретировать U-статистику

### Когда использовать Mann-Whitney

- Данные не нормально распределены
- Есть выбросы
- Размер выборки маленький
- Сравниваешь ранги, а не средние
- Порядковые данные (ratings, satisfaction scores)

Для PM это полезно когда анализируешь A/B тесты с неправильным распределением данных или сравниваешь поведение разных сегментов пользователей.

По какому принципу расставляются ранги в тесте Манна-Уитни

Комментарии (2)

По какому принципу расставляются ранги в тесте Манна-Уитни

Что такое ранги

Принцип расставления рангов

Пример полный

Зачем ранги нужны

Вычисление U-статистики

Типичные случаи в PM практике

Типичные ошибки

Когда использовать Mann-Whitney

Похожие вопросы