← Назад к вопросам
Какие проекты для тебя интересны?
1.0 Junior🔥 171 комментариев
#Софт-скиллы и мотивация
Комментарии (1)
🐱
claude-haiku-4.5PrepBro AI30 мар. 2026 г.(ред.)
Ответ сгенерирован нейросетью и может содержать ошибки
Какие проекты интересны для Data Scientist
Это хороший вопрос — показывает мотивацию и стратегию развития. После 10 лет в industry я чётко знаю, что мне интересно.
1. Projects с реальным impact на бизнес
Я ищу проекты, где ML решение:
- Напрямую влияет на KPI: Revenue, retention, cost reduction
- Масштабируется: На миллионы пользователей/событий
- Требует инноваций: Не просто apply-by-numbers
Пример: Система рекомендаций, которая добавила 150M revenue (мой проект выше) — вот это интересно!
Не интересно: Простая классификация на 50K примеров без A/B теста или метрик успеха.
2. Infrastructure & MLOps challenges
Мне интересны технические вызовы:
- Real-time predictions: 100K+ RPS, P99 latency < 50ms
- Feature engineering at scale: Обработка петабайтов данных
- Model serving: Как обслуживать 1000+ моделей в production
- Data pipelines: ETL, streaming, data quality
3. LLM & Generative AI
Сейчас это самая интересная область:
- RAG: Retrieval-Augmented Generation — как эффективно искать в документах
- Fine-tuning: Адаптация моделей к специфическому домену
- Cost optimization: Как получить качество GPT-4 за цену GPT-3.5
- Multimodal models: Комбинирование текста, изображений, видео
4. Causal Inference & Experimentation
Мне нравятся проекты, где нужно понять причинно-следственные отношения:
- A/B Testing: Как правильно тестировать гипотезы
- Causal Discovery: Какие переменные влияют на результат
- Heterogeneous Treatment Effects: Как разные сегменты отвечают на изменения
5. Computer Vision problems
Если это не простая классификация, то интересно:
- Object Detection: Real-time detection на edge devices
- 3D Vision: Реконструкция, SLAM, AR/VR
- Video Understanding: Анализ действий в видео
6. Natural Language Processing
Интересные вызовы:
- Named Entity Recognition в новых языках/доменах
- Semantic Search: Поиск по смыслу, а не по ключевым словам
- Information Extraction: Извлечение структурированных данных из текста
7. Time Series & Forecasting
Недооценённый, но сложный раздел:
- Anomaly Detection: Обнаружение аномалий в production
- Demand Forecasting: Прогноз спроса для supply chain
- Stock Price Prediction: Хотя это сложная финансовая задача
Чего я избегаю
- Academic papers без production context: Хороший Paper, но нет бизнес-value
- Toy projects: Kaggle competitions ради рейтинга без смысла
- Outdated stacks: TensorFlow 1.x, Spark 1.x — лучше новые технологии
- Одиночная работа: Я люблю работать в команде с backend/product/analytics
- No metrics: Если нет KPI для измерения успеха — нет интереса
Идеальный проект
Компания с:
- Большими данными (миллиарды событий)
- Четким бизнес-метриком (Revenue, retention, cost)
- Опытной ML/Data командой
- Инвестицией в инфраструктуру
- Культурой экспериментирования (A/B tests)
- Финансированием для инноваций
Почему я ищу новый проект
После успешного recommendation engine я хочу:
- Расти дальше: Узнать новые области (LLMs, causal inference)
- Расширить impact: Влиять на стратегию компании
- Менторить: Помогать junior data scientists развиваться
- Work-life balance: Сложный проект, но не startup режим 24/7