Data Science — это широкий диапазон компетенций, которые включают в себя различные уровни знаний и опыта. Компетенции, необходимые для начинающего Data Scientist, будут отличаться от тех, что требуются для опытного специалиста. Заметка основана на моих наблюдениях и опыте работы руководителем подразделения машинного обучения и Data Scienсе, возглавлял команду из 35+ человек и 7 стримов: Fintech, Devices, MobileAd и GEO, Компьютерное зрение, NLP, Внутренние проекты, CVM.
В заметке мы рассмотрим общие компетенции, без углубления в специфику NLP и Computer Vision специализации.
Junior Data Scientist
Сделаем небольшую ремарку, что рассматриваем на эту позицию в основном бывших стажеров и выпускников университетов/ курсов. Junior Data Scientist должен иметь следующие компетенции:
- Основы статистики и математики: линейная алгебра, теория вероятности и статистика
- Основы программирования на Python
- Базовые знания SQL и баз данных: какие базы бывают, как в теории они проектируются
- Умение работать с Excel и другими инструментами для обработки данных
- Понимание машинного обучения и алгоритмов, таких как линейная регрессия, логистическая регрессия и деревья решений
Middle Data Scientist
Middle Data Scientist должен обладать всему компетенциями Junior DS плюс нижеперечисленные скиллы:
- Углубленные знания математики и статистики, такие как теория оптимизации и временные ряды
- Умение работать с большими данными и использовать Big Data инструменты, такие как Hadoop и Spark. Этот пункт опционален и зависит от компании
- Опыт в построении моделей машинного обучения, наличие реализованных проектов
- Навыки визуализации данных и умение презентовать результаты анализа данных
Senior Data Scientist
Senior Data Scientist должен обладать всему компетенциями Middle DS плюс нижеперечисленные скиллы:
- Глубокое понимание машинного обучения и алгоритмов
- Умение создавать масштабируемые и высокопроизводительные системы обработки данных
- Навыки управления проектами и командой
В зависимости от компании и типа проекта, требуемые компетенции могут отличаться. Но в целом, эти компетенции могут служить основой для развития Data Scientist на любом уровне.
Софт скиллы для Data Scientists
Хороший Data Scientist не только владеет техническими навыками, но и обладает прокаченными софт скиллами. Вот основные скиллы, которые важны на разных уровнях:
Junior Data Scientist
- Умение работать в команде и сотрудничать с коллегами
- Обладание организационными навыками для планирования cвоих задач и управления своим рабочим временем
- Умение доносить сложную техническую информацию простым языком для неспециалистов
Middle Data Scientist
- Опыт в менторстве junior специалистов
- Умение находить нестандартные решения для задач
Senior Data Scientist
- Умение принимать стратегические решения и влиять на бизнес-результаты
- Опыт в обучении и наставничестве более молодых коллег
- Лидерство и умение вдохновлять других на достижение общих целей
Хорошие софт скиллы могут помочь Data Scientist достигнуть больших результатов в работе и продвинуться по карьерной лестнице. Они также могут повысить эффективность работы команды в целом.
Заключение
В заметке мы рассмотрели основные компетенции для разные уровней Data Science специалистов. Этот список компетенций можно использовать в своей компании для найма и грейдирования сотрудников.
Разговоры о Data Science – закрытый канал для общения на тему карьеры, развития профессиональных навыков и применения навыков на работе.