Комментарии (1)
Ответ сгенерирован нейросетью и может содержать ошибки
Профиль идеальной команды для меня
После 10+ лет в ML/DS я уже знаю, с какой командой я буду наиболее продуктивен. Вот подробный профиль.
Состав и размер
Оптимальный размер: 6-10 человек
1 Lead/Principal DS (менторство + архитектура)
2-3 Senior DS (production systems, difficult problems)
2-3 Junior/Mid DS (support, feature engineering)
1-2 ML Engineers (deployment, inference optimization)
1 Data Engineer (pipelines, infrastructure)
1 Product Manager (requirements, prioritization)
Почему именно такой размер:
- Достаточно для разделения труда
- Не слишком иерархична (max 3 уровня)
- Есть на кого делегировать
- Есть от кого учиться
Уровень expertise
Минимум 1 Principal/Lead Data Scientist, который:
- Публиковал papers или работал в FAANG/ML companies
- Может провести code review и дать feedback
- Задаёт стандарты качества
- Не боится сказать "это нельзя, потому что..."
2-3 Senior Data Scientists, которые:
- Имеют 5+ лет опыта
- Специализируются в разных областях (NLP, CV, time-series, RL, etc.)
- Могут наставлять junior'ов
- Участвуют в архитектурных решениях
Технический стек команды
Идеальный стек для меня:
Infrastructure:
- Cloud: AWS / GCP / Azure (не on-premise)
- Data Warehouse: Snowflake или BigQuery
- Container: Docker + Kubernetes (или хотя бы Docker)
- CI/CD: GitHub Actions / GitLab CI / Jenkins
ML/Data:
- Python 3.10+ (не старый код)
- PyTorch или TensorFlow для DL
- Scikit-learn для классических алгоритмов
- Experiment tracking: MLflow, wandb, или Neptune
- Feature store: tecton, feast, или homemade
Data Quality:
- Data validation (Great Expectations)
- Monitoring (Prometheus + Grafana, или DataDog)
- dbt для transformation pipelines
# Хороший знак: есть well-documented ML pipeline
# Плохой знак: "у нас есть Jupyter ноутбуки с версиями v1, v2, v3_final, v3_final_real..."
Характер работы
Баланс между research и production
Я ищу 40% research / 60% production split:
- 40% — экспериментирование, новые идеи, статьи
- 60% — улучшение production моделей, A/B тесты, мониторинг
Не хочу:
- 90% production support (burn out от on-call)
- 90% research (модели, которые никогда не пойдут в prod)
Задачи должны быть разнообразны:
- Feature engineering (30%)
- Model development (30%)
- A/B testing (20%)
- Production support & monitoring (20%)
Культура команды
1. Psychological Safety
- Можно сказать "я не знаю" без стыда
- Есть нормальные post-mortems при ошибках (без finger-pointing)
- Ценят questions и divergent thinking
2. Data-Driven Decision Making
- Решения принимаются на основе данных, не HiPPO (Highest Paid Person's Opinion)
- Есть A/B тесты для значимых решений
- Метрики clearly defined
3. Ownership & Autonomy
- Я "owns" проект от начала до конца
- Нет микроменеджмента
- Есть clear goals (OKRs) и я сам выбираю путь
4. Collaborative, Not Competitive
- Люди готовы помочь, не "борются" за внимание
- Code reviews конструктивные, не критиковующие
- Есть пространство для парной работы
Тип компании
Предпочитаю:
- Series C-D стартапы (уже есть product-market fit, но ещё растут)
- Mid-size tech companies (50-500 employees)
- FAANG/Big Tech (для research-heavy роли)
Не подходит мне:
- Pre-seed/Seed (нет ресурсов для ML)
- Huge corporations (400+ слои иерархии)
- Legacy companies (медленное принятие решений)
Доменные области интереса
В порядке предпочтения:
Tier 1 (Very Interesting):
- Финтех (fraud detection, credit risk, algorithmic trading)
- Здравоохранение (diagnosis, drug discovery)
- E-commerce (recommendations, demand forecasting)
Tier 2 (Interesting):
- AdTech (CTR prediction, attribution)
- Logistics (routing, forecasting)
- Social Networks (feed ranking)
Tier 3 (Okay):
- B2B SaaS analytics
- HR Tech
- Gaming
Never:
- Crypto scams
- Schemes, gambling
- Anything unethical
Work-Life Balance
Требования:
- Не более 45 часов в неделю в среднем
- No on-call по ночам (максимум во время critical incidents)
- 20+ дней отпуска в году
- Возможность remote work (минимум 2 дня в неделю, лучше 100%)
- Flexible hours (не нужно быть онлайн 9-5)
Расширенный лист желаний
- Возможность публикации. Статьи, конференции, open-source
- Бюджет на обучение. $2K-5K в год на курсы, книги, конференции
- Гибкость в инструментах. Дают ноут с моей ОС (Linux, Mac, Windows)
- Интернациональность. Команда из разных стран (разнообразие идей)
- Tech сообщество. Есть внутренние tech talks, meetups
Красные флаги при поиске команды
- Все Data Scientists на контрактах (нестабильность)
- Новый DS приходит, а старый уходит каждые 6 месяцев
- "Мы всегда в авралах, это нормальная культура"
- Lead Data Scientist не знает основ ML
- Нет стандартов: у каждого свой стиль кода
- "Вы первый DS в компании" (= не будет менторства)
Процесс поиска
Когда я кандидирую, я не только прохожу интервью, но и интервьюирую их:
Вопросы, которые я задаю:
- Какие модели сейчас в production? Какие версии? Как часто ретрейните?
- Покажите ваш ML pipeline. Где bottleneck?
- Расскажите о последней ошибке в production. Как её обработали?
- Какой процент времени уходит на meeting'и vs coding?
- Есть ли примеры, когда ML модель значительно повлияла на бизнес?
- Как долго новый DS доходит до первого pull request?
Вывод
Я ищу команду, где:
- Technical excellence — стандарты качества высокие
- Psychological safety — можно быть собой
- Growth — всегда есть чему учиться
- Impact — моя работа видна бизнесу
- Balance — не burn out за 2 года
Я не ищу идеальную команду, но ищу место, где я смогу расти и вносить вклад одновременно.