← Назад к вопросам

Что делает рекомендательная модель?

2.3 Middle🔥 191 комментариев
#Рекомендательные системы#Машинное обучение

Комментарии (1)

🐱
claude-haiku-4.5PrepBro AI30 мар. 2026 г.(ред.)

Ответ сгенерирован нейросетью и может содержать ошибки

Рекомендательные модели: назначение и функция

Рекомендательная модель — это система, которая предсказывает предпочтения пользователя и предлагает ему наиболее релевантные товары, контент или услуги. Это один из критических компонентов любой платформы е-коммерса, видеосервиса, музыкального стриминга и социальных сетей.

Основная задача

Рекомендательная модель решает проблему информационной перегрузки — из миллионов товаров/фильмов/песен выбрать несколько, которые пользователю действительно понравятся. Это увеличивает:

  • Engagement — пользователь дольше остается на платформе
  • Конверсию — больше покупок
  • Retention — пользователь возвращается снова
  • AOV (Average Order Value) — средний чек растет

Как работает предсказание

Модель анализирует:

Входные данные:
├─ История действий пользователя (клики, покупки, просмотры)
├─ Характеристики товара/контента
├─ Данные других пользователей с похожим поведением
└─ Контекстная информация (время, устройство, локация)
     ↓
Преобразование в векторное представление
     ↓
Прохождение через модель (дерево, нейросеть, факторизация)
     ↓
Предсказание скора релевантности для каждого товара
     ↓
Топ-N товаров с наибольшим скором

Типы подходов

1. Коллаборативная фильтрация (Collaborative Filtering)

Основана на принципе: "людям, которые нравились одни вещи, нравятся и другие вещи".

# User-to-user similarity
похожие_пользователи = найти_k_соседей(текущий_пользователь)
рекомендации = товары_которые_нравились_соседям()

# Item-to-item similarity (более стабильная)
если_пользователь_лайкнул(товар_А):
    рекомендовать(похожие_товары_на_А)

# Matrix Factorization (SVD, NMF)
# Матрица пользователей x товаров факторизуется в две низкоранговые матрицы
R ≈ U * V.T
скор = U[пользователь] * V[товар].T

Плюсы: работает без информации о товарах, отлично для нишевых предпочтений. Минусы: холодный старт (новые пользователи/товары), спарсивость данных.

2. Контентное фильтрование (Content-Based)

Рекомендует товары похожие на те, что пользователю уже нравились.

# Используются признаки товара
текущий_профиль = усредненный_профиль(товары_что_понравились)
счёт = сходство(текущий_профиль, новый_товар)
если счёт > порог:
    рекомендовать(новый_товар)

Плюсы: хорошо для холодного старта товаров, легко объяснить (эта книга похожа на прочитанную). Минусы: ограниченная диверсификация рекомендаций, нужна хорошая информация о товарах.

3. Гибридные модели

Комбинируют оба подхода + добавляют:

  • Контекстуальную информацию (время, место, поведение в сессии)
  • Метаданные товара (категория, тэги, описание)
  • Графовые сигналы (социальный граф, граф похожести товаров)
скор = (0.4 * collaborative_score +
        0.3 * content_score +
        0.2 * contextual_score +
        0.1 * trend_score)

4. Глубокие нейросети (Deep Learning)

# Embedding-based подход
user_embedding = embedding_layer(user_features)
item_embedding = embedding_layer(item_features)

score = neural_network([user_embedding, item_embedding])

Популярные архитектуры:

  • Wide & Deep — обобщение + запоминание деталей
  • DeepFM — факторизационные машины + нейросеть
  • Two-Tower — отдельные башни для пользователя и товара, скор = произведение

Примеры в индустрии

YouTube: комбинация контент-баз и коллаб. фильтрации + огромное внимание к engagement сигналам.

Netflix: матричная факторизация, но с учетом временных тренов (популярность меняется).

Amazon: гибридная система с тяжелым весом на покупки похожих товаров.

Spotify: коллаб. фильтрация на явных данных (плейлисты) + контент-баз на признаках песен.

Метрики качества

  • Precision@K — доля релевантных в топ-K
  • Recall@K — доля релевантных из всех релевантных
  • NDCG@K — учитывает позицию в ранжировании
  • MAP@K — средняя точность
  • Coverage — доля товаров которые рекомендуются
  • Diversity — разнообразие рекомендаций
  • Serendipity — неожиданность и полезность

Вызовы

  1. Холодный старт — новые пользователи/товары без истории
  2. Спарсивость — большинство пользователей видели < 1% товаров
  3. Дрейф — предпочтения меняются со временем
  4. Фильтровые пузыри — рекомендации только похожего контента
  5. Масштабируемость — миллиарды товаров и пользователей

Рекомендательные системы — это не просто ML, а комплексное решение, требующее данных, инженерии, экспериментов и постоянного мониторинга.

Что делает рекомендательная модель? | PrepBro