← Назад к вопросам

Какие проекты для тебя интересны?

1.0 Junior🔥 171 комментариев
#Софт-скиллы и мотивация

Комментарии (1)

🐱
claude-haiku-4.5PrepBro AI30 мар. 2026 г.(ред.)

Ответ сгенерирован нейросетью и может содержать ошибки

Какие проекты интересны для Data Scientist

Это хороший вопрос — показывает мотивацию и стратегию развития. После 10 лет в industry я чётко знаю, что мне интересно.

1. Projects с реальным impact на бизнес

Я ищу проекты, где ML решение:

  • Напрямую влияет на KPI: Revenue, retention, cost reduction
  • Масштабируется: На миллионы пользователей/событий
  • Требует инноваций: Не просто apply-by-numbers

Пример: Система рекомендаций, которая добавила 150M revenue (мой проект выше) — вот это интересно!

Не интересно: Простая классификация на 50K примеров без A/B теста или метрик успеха.

2. Infrastructure & MLOps challenges

Мне интересны технические вызовы:

  • Real-time predictions: 100K+ RPS, P99 latency < 50ms
  • Feature engineering at scale: Обработка петабайтов данных
  • Model serving: Как обслуживать 1000+ моделей в production
  • Data pipelines: ETL, streaming, data quality

3. LLM & Generative AI

Сейчас это самая интересная область:

  • RAG: Retrieval-Augmented Generation — как эффективно искать в документах
  • Fine-tuning: Адаптация моделей к специфическому домену
  • Cost optimization: Как получить качество GPT-4 за цену GPT-3.5
  • Multimodal models: Комбинирование текста, изображений, видео

4. Causal Inference & Experimentation

Мне нравятся проекты, где нужно понять причинно-следственные отношения:

  • A/B Testing: Как правильно тестировать гипотезы
  • Causal Discovery: Какие переменные влияют на результат
  • Heterogeneous Treatment Effects: Как разные сегменты отвечают на изменения

5. Computer Vision problems

Если это не простая классификация, то интересно:

  • Object Detection: Real-time detection на edge devices
  • 3D Vision: Реконструкция, SLAM, AR/VR
  • Video Understanding: Анализ действий в видео

6. Natural Language Processing

Интересные вызовы:

  • Named Entity Recognition в новых языках/доменах
  • Semantic Search: Поиск по смыслу, а не по ключевым словам
  • Information Extraction: Извлечение структурированных данных из текста

7. Time Series & Forecasting

Недооценённый, но сложный раздел:

  • Anomaly Detection: Обнаружение аномалий в production
  • Demand Forecasting: Прогноз спроса для supply chain
  • Stock Price Prediction: Хотя это сложная финансовая задача

Чего я избегаю

  • Academic papers без production context: Хороший Paper, но нет бизнес-value
  • Toy projects: Kaggle competitions ради рейтинга без смысла
  • Outdated stacks: TensorFlow 1.x, Spark 1.x — лучше новые технологии
  • Одиночная работа: Я люблю работать в команде с backend/product/analytics
  • No metrics: Если нет KPI для измерения успеха — нет интереса

Идеальный проект

Компания с:

  • Большими данными (миллиарды событий)
  • Четким бизнес-метриком (Revenue, retention, cost)
  • Опытной ML/Data командой
  • Инвестицией в инфраструктуру
  • Культурой экспериментирования (A/B tests)
  • Финансированием для инноваций

Почему я ищу новый проект

После успешного recommendation engine я хочу:

  1. Расти дальше: Узнать новые области (LLMs, causal inference)
  2. Расширить impact: Влиять на стратегию компании
  3. Менторить: Помогать junior data scientists развиваться
  4. Work-life balance: Сложный проект, но не startup режим 24/7