[01] CURRICULUM · BASE TRACK

Данные: мышление и инструменты

Шесть модулей, шесть месяцев, портфолио из шести публичных кейсов

Базовый трек подготовки к позиции junior data analyst для взрослых 25–40 без технического бэкграунда. От бизнес-вопроса до SQL, BI-дашборда, статистических проверок и Python-капстона. На выходе — публичные артефакты в GitHub и Looker Studio, с которыми можно идти на собеседования.

МОДУЛЕЙ

+ онбординг (Неделя 0)

МИНИ-ВИДЕО

~96

3–5 минут каждое

АРТЕФАКТЫ

6+1

Публичных + капстон

ВХОД

Офисный пользователь с базовым Excel. Не-программист. SQL и Python с нуля. Бизнес-опыт не обязателен — закрывает онбординг.

ВЫХОД

Junior data analyst entry-level: SQL с окнами и CTE, BI-дашборд по принципам Tufte, базовая статистика и A/B-тесты, Python pandas + капстон.

ТЕМП

1 модуль = 1 месяц. Минимальный темп — 2 недели на модуль (для срабатывания SRS). Рекомендуемая нагрузка — 30–45 мин/день.

[02] THEORY / PRACTICE RATIO

75% практики против 25% теории

В среднем по модулю в Basic: 16 мини-видео ≈ 60 мин теории против ≈ 180 мин практики (тренажёры, micro-output, weekly-артефакты, чек-поинт). В Pro практики больше за счёт АИ-ревью кода и расширенных задач.

ВИДЕО-ТЕОРИЯ · 25%ПРАКТИКА · 75%

~60 мин/модуль

16 мини-видео по 3–5 минут

~180 мин/модуль

тренажёры · SRS · weekly-артефакты · чек-поинт

SRS-КАРТОЧЕК

~412

Термины и синтаксис в spaced repetition

CAN-DO STATEMENTS

Проверяемых навыков по итогам трека

ЕЖЕДНЕВНО

30–45 мин

Минимальный технический порог — 2 недели/модуль

[03] PROGRAM MAP

Онбординг + шесть модулей · от вопроса до капстона

[04] ONBOARDING · НЕДЕЛЯ 0

Зачем тебе data analytics

Закрыть пропасть «хочу выучить data analytics» ↔ «понимаю, что это и зачем». До старта Модуля 1 показать роль аналитика изнутри: бизнес-контекст, день из жизни, типы аналитиков, рынок РФ.

Неделя 0 · бесплатный freemium-вход·5–7 дней, ~3–5 часов суммарно

5 видео онбординга

0.1
Что такое data analytics за 5 минут
Метафора «детектив для бизнеса» + 5 типов вопросов: descriptive, diagnostic, predictive, prescriptive, experimental.
5 мин
0.2
Зачем бизнес платит аналитикам
Бизнес тонет в данных. Решения наугад дороги. 3 кейса с конкретными цифрами ROI.
5 мин
0.3
Один день junior data analyst в e-commerce
Конкретный нарратив: утренний sync → запрос от продакта → SQL → pandas → дашборд → презентация выводов.
7 мин
0.4
5 типов аналитиков и где они работают
Продуктовый, маркетинг, BI, операционный, финансовый. Где работают, зарплаты в РФ, как переходят между.
5 мин
0.5
Карта трека «Данные: мышление и инструменты»
Обзор 6 модулей. Что будет легко, что трудно. Когда ожидать «плато».
4 мин

3 блока самодиагностики

●
Готов ли ты технически?
●
Какой ты тип аналитика?
●
Что ты хочешь через 6 месяцев?

Финальный артефакт онбординга

Личный манифест

200–300 слов или 60-секундное голосовое: кто я → зачем мне DA → какой тип аналитика мне ближе → что я планирую через 6 месяцев → что готов делать каждый день. Сохраняется в профиле и показывается на 30/60/90-й день и в финале трека как commitment device.

[05] MODULES · 6 БЛОКОВ ПО МЕСЯЦУ

От Excel и SMART-вопросов до Python и капстон-исследования

Недели 1-4 · бесплатный модуль

ДОСТУПЕН БЕСПЛАТНО

Мышление аналитика + Excel

Сформулировать SMART-вопрос к данным. Освоить гигиену данных. Уверенно работать в Excel/Sheets: сводные, Power Query, ключевые формулы. Построить первое мини-исследование на открытых данных.

Чему учим

SMART-вопрос к данным (кто-что-когда-в каком срезе-по сравнению с чем)
Tidy data: 1 строка = 1 наблюдение, 1 колонка = 1 свойство
Типы данных и приведение в Excel/Power Query
Работа с датами: ISO-формат, серийные числа
XLOOKUP, SUMIFS, COUNTIFS, AVERAGEIFS
IF, IFS, LET — условная логика
UNIQUE, FILTER, SORT — динамические массивы
Сводные таблицы и срезы
Power Query: импорт, объединение, refresh
Базовая визуализация — один график, одна мысль

Структура по неделям · 4 нед · 16 видео

Неделя 1

Мышление аналитика: от вопроса бизнеса к ответу в данных

1.1Зачем аналитик. Чем отличается «посмотри данные» от работы аналитика
1.2SMART-вопрос к данным
1.3Гипотеза и её проверка
1.4Корреляция ≠ причинность: ловушка новичка

Артефакт недели

Три SMART-вопроса к датасету

Неделя 2

Данные: гигиена, типы, пропуски, дубликаты

2.1Что такое tidy data
2.2Типы данных и почему это важно
2.3Даты: почему Excel — это боль
2.4Пропуски и дубликаты

Артефакт недели

Полный пайплайн гигиены

Неделя 3

Excel-формулы: отвечаем на вопросы к данным

3.1XLOOKUP: соединение двух таблиц
3.2SUMIFS, COUNTIFS, AVERAGEIFS
3.3IF, IFS, LET
3.4UNIQUE, FILTER, SORT

Артефакт недели

5 ответов на бизнес-вопросы только формулами

Неделя 4

Сводные таблицы + Power Query + артефакт

4.1Сводная таблица: ваш главный инструмент
4.2Power Query: импорт и очистка
4.3Первый честный график
4.4Сборка: от вопроса к отчёту

Артефакт недели

Подготовка к финальному артефакту модуля

Финальный артефакт модуля

Моё первое мини-исследование

1-страничный отчёт в Excel/Sheets + 1-минутное голосовое видео. Структура: бизнес-контекст → 3 SMART-вопроса → ответы со сводными/графиками → вывод и рекомендация.

Чек-поинт модуля

Basic: 15 заданий: 10 на концепты (типы, формулы, интерпретация) + 5 в Excel-тренажёре. 1 mini-investigation на 1 бизнес-вопрос.

Pro: Всё из Basic + детальный АИ-отчёт о сильных/слабых местах + рекомендации по персонализации модуля 2.

Недели 5-8 · первый платный модуль

SQL: разговор с данными (база)

Освоить базовый SQL: SELECT, WHERE, ORDER BY, DISTINCT. Агрегации с GROUP BY и HAVING. Соединение таблиц через INNER JOIN и LEFT JOIN. Базовые функции дат и строк.

Чему учим

Реляционная модель: таблицы, ключи (PK/FK), связи
SELECT, FROM, WHERE, ORDER BY, LIMIT, DISTINCT
WHERE-логика: AND/OR/NOT, IN, BETWEEN, LIKE, IS NULL
Агрегации: COUNT(*), COUNT(DISTINCT), SUM, AVG, MIN, MAX
GROUP BY и HAVING (разница с WHERE)
INNER JOIN и LEFT JOIN
Цепочка JOIN-ов на 3+ таблицы
Дата-функции: DATE_TRUNC, EXTRACT, INTERVAL

Структура по неделям · 4 нед · 16 видео

Неделя 5

SELECT и WHERE: первый разговор с базой

5.1Реляционная база за 4 минуты
5.2Первый SELECT: показать всё / показать колонки
5.3WHERE: первый фильтр
5.4ORDER BY и LIMIT: первые правила

Артефакт недели

Знакомство с базой — 5 explore-запросов

Неделя 6

WHERE-логика и DISTINCT

6.1IN, NOT IN, BETWEEN
6.2LIKE / ILIKE и поиск по шаблону
6.3NULL: главная ловушка SQL
6.4DISTINCT: когда нужен, когда мешает

Артефакт недели

Карта пользователей — 6 запросов

Неделя 7

Агрегации и GROUP BY

7.1Считаем: COUNT, SUM, AVG, MIN, MAX
7.2COUNT(*) vs COUNT(column) vs COUNT(DISTINCT)
7.3GROUP BY: режем по группам
7.4HAVING vs WHERE

Артефакт недели

Бизнес-метрики первого порядка — 8 запросов

Неделя 8

JOIN: соединяем таблицы и собираем артефакт

8.1Зачем JOIN. INNER JOIN на пальцах
8.2LEFT JOIN: сохраняем «бездомных»
8.3JOIN + GROUP BY: главный паттерн аналитика
8.4Цепочка JOIN-ов: 3+ таблицы

Артефакт недели

Подготовка к финальному артефакту модуля

Финальный артефакт модуля

20 SQL-запросов к e-commerce базе

Подборка из 20 запросов разной сложности (от базовых до сцепок), опубликованная в GitHub Gist с README по каждому: бизнес-вопрос → запрос → цифра-ответ → интерпретация.

Чек-поинт модуля

Basic: 18 заданий: 12 на материал модуля 2 (SELECT/WHERE, GROUP BY, JOIN), 6 — interleaved из модуля 1 (мышление, типы, гигиена). 1 mini-investigation.

Pro: + детальный АИ-отчёт + автоподстройка модуля 3 под слабые зоны.

Недели 9-12

SQL: продвинутый + чистка данных

Освоить CTE и оконные функции. 5 ключевых бизнес-паттернов: когортный retention, conversion funnel, top-N per group, running total/MoM, RFM-сегментация. Чистка «грязных» данных в SQL.

Чему учим

CTE: WITH ... AS, цепочка CTE
Подзапросы: scalar, IN/EXISTS, в FROM
Оконные функции: ROW_NUMBER, RANK, DENSE_RANK, LAG/LEAD, SUM/AVG OVER
PARTITION BY и ORDER BY внутри окна
Frame: ROWS BETWEEN ... для running total и rolling
CASE WHEN для условной логики и сегментации
NULL-логика: COALESCE, NULLIF, агрегаты с NULL
Чистка строк: TRIM, LOWER, REPLACE, базовый regex
Безопасный CAST через CASE
5 бизнес-паттернов: когорта/funnel/top-N/running total/RFM

Ментальные модели

CTE как именованные шаги. Сложный запрос = последовательность именованных шагов через WITH. Читается сверху вниз, как инструкция.
Окно = GROUP BY, который не схлопывает. GROUP BY: 1000 строк → 5 строк сводной. Окно: 1000 строк → 1000 строк, в каждой добавлен агрегат группы.
PARTITION BY = деление плоскости. PARTITION BY задаёт границы рамки окна (по странам / по пользователям). ORDER BY — порядок движения внутри.
NULL = неизвестно, не пусто. NULL ≠ NULL. WHERE col != X пропускает NULL. SUM пропускает NULL. Это объясняет 90% «у меня цифра не сходится».
Запрос — это конвейер. Логический порядок: FROM → JOIN → WHERE → GROUP BY → HAVING → SELECT → DISTINCT → ORDER BY → LIMIT.

Структура по неделям · 4 нед · 16 видео

Неделя 9

CTE и подзапросы: организуем сложные запросы

9.1Когда JOIN + GROUP BY уже не хватает
9.2CTE: именованные шаги решения
9.3Подзапросы: scalar и в WHERE
9.4EXISTS vs IN: когда что

Артефакт недели

Перепиши через CTE — 5 запросов

Неделя 10

Оконные функции: общее

10.1Зачем окна: ментальная модель
10.2PARTITION BY: делим на участки
10.3ROW_NUMBER, RANK, DENSE_RANK
10.4LAG и LEAD: сравнение со «соседом»

Артефакт недели

Mini-investigation: первый когортный анализ

Неделя 11

Оконные функции: продвинутые + CASE

11.1SUM/AVG OVER + frame: running total
11.2Rolling average и MoM
11.3Top-N per group: магия PARTITION BY
11.4CASE WHEN: условная логика и сегментация

Артефакт недели

Воронка пользователя

Неделя 12

NULL, чистка данных, артефакт

12.1NULL — это не ноль и не пусто
12.2COALESCE, NULLIF, защита от деления на ноль
12.3Чистка строк в SQL: разный регистр, пробелы, опечатки
12.4Сборка: от грязных данных до отчёта

Артефакт недели

Финализация артефакта модуля

Финальный артефакт модуля

10 SQL-запросов junior+ уровня

10 бизнес-вопросов, каждый — одним запросом с CTE и/или окнами. Когортный retention, conversion funnel, top-N per group, RFM, MoM-рост, дедупликация по чистке. Публикуется в публичном GitHub-репозитории.

Чек-поинт модуля

Basic: 20 заданий: 14 на материал модуля 3, 6 — interleaved из модулей 1–2. 1 mini-investigation.

Pro: + детальный АИ-отчёт + автоподстройка модуля 4.

Недели 13-16

Визуализация и BI: дашборды, которые принимают решения

Освоить принципы Tufte/гештальта/pre-attentive. Уверенно работать в Looker Studio: подключение, blends, расчётные поля, фильтры, drill-down, публикация. Знать Power BI как «второй язык». Применять data storytelling.

Чему учим

5 принципов Tufte: data-ink, нулевая ось, цвет=смысл, минус chartjunk, контекст
Гештальт: proximity / similarity / enclosure / continuity / closure
Pre-attentive: цвет / размер / position / orientation / length
8 типов графиков и когда какой
Цветовая теория: sequential / diverging / categorical, colorblind-friendly
Looker Studio: подключения, blends, controls, drill-down, themes, publish
Расчётные поля Looker: SAFE_DIVIDE, CASE, DATETIME_DIFF, REGEXP
Power BI обзорно: интерфейс, базовый DAX (5 функций)
Storytelling: glance / scan / investigate, F-pattern, Z-pattern

Ментальные модели

Дашборд = ответ на вопрос. Если ты не можешь объяснить вопрос дашборда в одном предложении за 5 секунд — сначала сформулируй вопрос.
Data-ink ratio (Tufte). data-ink / total-ink. Если можешь убрать пиксель без потери смысла — убирай.
Гештальт: глаз группирует автоматически. Близость / схожесть / рамка / выравнивание управляют вниманием. Используй их осознанно.
Pre-attentive за 200 мс. 1 яркий цвет на сером фоне = магнит. Если все элементы выделены — никто не выделен.
F-pattern и Z-pattern. Главный KPI — верх-лево, action — низ-право. Размещай по приоритету чтения.

Структура по неделям · 4 нед · 16 видео

Неделя 13

Принципы честной визуализации и выбор типа графика

13.1Дашборд = ответ на вопрос, а не панель метрик
13.2Tufte за 5 минут: data-ink, chartjunk, lie factor
13.3Выбор типа графика: 8 типов и когда какой
13.4Манипуляции: галерея «как графики врут»

Артефакт недели

Аудит чужого дашборда

Неделя 14

Looker Studio: первый дашборд от подключения до публикации

14.1Looker Studio за 5 минут: интерфейс и логика
14.2Первая визуализация: KPI-карточка
14.3Bar chart, line chart, scatter — три рабочие лошадки
14.4Контролы и фильтры: интерактив за 5 минут

Артефакт недели

Mini-dashboard 1: профиль магазина

Неделя 15

Расчётные поля, цвет, иерархия

15.1Расчётные поля Looker Studio: ratio, MoM, % of total
15.2Цветовая палитра: 3 типа, colorblind-friendly
15.3Visual hierarchy: главное на дашборде
15.4Гештальт-группировка элементов

Артефакт недели

Mini-dashboard 2: воронка пользователей

Неделя 16

Storytelling, mobile, Power BI обзор + артефакт

16.1Storytelling: дашборд как narrative
16.2Mobile-responsiveness: дашборд на телефоне
16.3Power BI обзор: интерфейс и базовый DAX
16.4Подготовка артефакта: чек-лист 12 принципов

Артефакт недели

Финализация публичного дашборда

Финальный артефакт модуля

Public Looker Studio dashboard

1-страничный дашборд с главным KPI + 4–5 визуализаций + 2–4 фильтра, опубликованный по public-ссылке. README с разделом «Решения по дизайну».

Чек-поинт модуля

Basic: 22 задания: 16 на материал модуля 4, 6 — interleaved.

Pro: + детальный АИ-отчёт + автоподстройка модуля 5.

Недели 17-20

Статистика для аналитика: численная честность

Перейти от «цифра = факт» к «цифра = диапазон с обоснованной интерпретацией». Описательная статистика, доверительные интервалы, A/B-тесты, антипаттерны (p-hacking, multiple testing, Simpson).

Чему учим

Меры центра: mean / median / mode + когда какой
Меры разброса: std / IQR / quartile / percentile
Распределения: normal / lognormal / skewed / bimodal / heavy-tailed
Visualization: histogram / boxplot / ECDF
Sampling: population vs sample, bias-ы, sample size
Доверительные интервалы через bootstrap
Гипотезы: H0/H1, p-value (правильная интерпретация)
A/B-тест: дизайн, MDE, primary + guardrail metrics
Effect size: Cohen's d, lift, абсолют
Антипаттерны: p-hacking, HARKing, multiple testing, Simpson
5 вопросов скептика к любой цифре

Ментальные модели

Распределение, а не одно число. Любая цифра — сжатие распределения. Сжатие теряет информацию. Всегда смотри histogram/boxplot.
Шум + сигнал. Любая измеренная цифра = истина + шум. CI и p-value — про разделение шума и сигнала.
Гипотеза наоборот. Не «доказываем гипотезу», а «отвергаем нулевую». «Не отвергли» — это не «гипотеза неверна», это «доказательств недостаточно».
P-value — это не то, что вы думаете. P-value = «вероятность таких данных при условии H0». НЕ вероятность гипотезы, НЕ сила эффекта, НЕ вероятность повторения.
Frequentist CI. 95% CI = «при повторении эксперимента 1000 раз в 950 интервалах будет истина». Это про процедуру, не про конкретный интервал.
Simpson: агрегация скрывает структуру. Тренд в каждой подгруппе исчезает или меняется на противоположный при агрегации. Прежде чем делать вывод — смотри сегменты.
Effect size > p-value. P-value говорит «шум или нет». Effect size говорит «важно ли это». Из всех чисел отчёта — самое важное именно effect size.

Структура по неделям · 4 нед · 16 видео

Неделя 17

Описательная статистика и форма распределения

17.1Mean, median, mode: три ответа на «среднее»
17.2Std, IQR, percentiles: измеряем разброс
17.3Histogram, boxplot, ECDF: смотрим на форму
17.4Outliers: что с ними делать

Артефакт недели

Distribution analysis

Неделя 18

Sampling, доверительные интервалы, бутстрап

18.1Population vs sample: что мы вообще измеряем
18.2Variance в выборке: standard error и доверительный интервал
18.3Bootstrap-симуляция: CI на пальцах
18.4Sample size calculation (интуитивно)

Артефакт недели

CI и интерпретация

Неделя 19

Гипотезы, p-value, A/B-тест

19.1Гипотеза работает наоборот: H0 и H1
19.2P-value за 5 минут (без мистики)
19.3A/B-тест: дизайн, метрики, MDE
19.4Effect size: что важнее p-value

Артефакт недели

Mock A/B-тест

Неделя 20

Антипаттерны: p-hacking, multiple testing, Simpson + артефакт

20.1P-hacking, HARKing, cherry-picking
20.2Multiple testing problem и поправки
20.3Simpson's paradox и confounders
20.4Когда A/B-тест нельзя проводить

Артефакт недели

Финализация A/B Test Report

Финальный артефакт модуля

A/B Test Investigation Report

2–3-страничный PDF-отчёт по разбору одного из 5 заранее подготовленных A/B-тестов. Структура: контекст → гипотеза → дизайн → анализ → ограничения → рекомендация бизнесу.

Чек-поинт модуля

Basic: 24 задания: 18 на материал модуля 5, 6 — interleaved.

Pro: + детальный АИ-отчёт + голосовая защита одного вывода.

Недели 21-25

Python для анализа + горизонт инструментов + капстон

Освоить Python и pandas как «новый SQL». Получить горизонт инструментов после pandas: Polars, DuckDB, PySpark на уровне обзора и сравнения. Капстон — синтез всего трека: SQL → pandas → визуализация → статистика → отчёт → защита.

Чему учим

Python-базис: variables, lists, dicts, functions
Jupyter: cells, markdown, kernel, Restart & Run All
pandas DataFrame = SQL-таблица (мост от модуля 3)
Selection: .loc / .iloc, boolean indexing, .query()
Transform: .assign, .rename, .astype, .to_datetime
Group: .groupby, .agg, .transform, .pivot_table
Merge: .merge с правильным выбором how
Strings: .str.lower / .str.contains / .str.extract
Dates: pd.to_datetime, .dt.year/.month/.dayofweek
Векторизация vs циклы
matplotlib + seaborn: 7 базовых графиков
scipy.stats: ttest_ind, bootstrap, описательная статистика
Воспроизводимость: random seed, requirements.txt, paths
Polars: lazy/eager, .lazy(), .collect(), expressions API
DuckDB: SQL поверх Parquet/CSV без warehouse
PySpark обзорно: DataFrame API, .show() vs .collect(), идея кластера
Карта инструментов: когда pandas / Polars / DuckDB / PySpark

Ментальные модели

DataFrame = SQL-таблица. Все ключевые операции SQL имеют прямой эквивалент в pandas. Учим через мост.
Векторизация vs итерация. На 100к строк цикл = 30 сек, векторизация = 0,1 сек. Это другой способ мыслить.
Notebook как нарратив. Скрипт = команды для машины. Notebook = рассказ для человека. Markdown между ячейками обязателен.
Pure transformation. Каждая ячейка — один input, один output. df_raw → df_clean → df_filtered → df_final.
Воспроизводимость. Random seed + requirements + relative paths + Restart & Run All. Капстон должен запускаться у любого.
Карта инструментов после pandas. Сначала задача и объём данных, потом инструмент. До 100МБ — pandas. До 50ГБ — Polars. SQL поверх файлов — DuckDB. 500ГБ+ или промышленный ETL — PySpark. «Я хочу взять Spark» — неправильный старт.

Структура по неделям · 5 нед · 21 видео

Неделя 21

Python и Jupyter: pandas как «новый SQL»

21.1Python для data analyst за 10 минут
21.2Jupyter notebook: code, markdown, нарратив
21.3DataFrame = SQL-таблица: первый pandas
21.4SELECT и WHERE в pandas

Артефакт недели

Notebook 1: знакомство с данными

Неделя 22

pandas-операции: groupby, merge, очистка

22.1groupby — главный инструмент
22.2merge — JOIN в pandas
22.3Очистка: NaN, дубликаты, типы
22.4Векторизация: почему pandas в 100 раз быстрее циклов

Артефакт недели

Notebook 2: подготовка данных

Неделя 23

EDA + визуализация в Python

23.1Описательная статистика в pandas (мост от модуля 5)
23.2seaborn за 10 минут: 7 графиков
23.3Bootstrap CI и t-test в коде
23.4Финальные графики: from seaborn to publication

Артефакт недели

Notebook 3: EDA + статистика

Неделя 24

Когда pandas заканчивается: Polars, DuckDB, PySpark

24.1Когда pandas заканчивается: 4 признака и 3 пути
24.2Polars: pandas на стероидах
24.3DuckDB: SQL прямо по Parquet
24.4PySpark в облаке: концепция кластера за 10 минут
24.5Сравнение четырёх движков на одном датасете

Артефакт недели

Notebook 4: горизонт инструментов

Неделя 25

Капстон-неделя: синтез всего

25.1Структура капстон-репо: anatomy эталона
25.2README как product page
25.3Защита капстона: 5-минутное голосовое видео
25.4Резюме под junior-вакансию

Артефакт недели

Финализация капстона + защита (Pro)

Финальный артефакт модуля

Капстон: полное аналитическое исследование

GitHub-репо по эталонной структуре: 4 notebook-а (EDA / cleaning / analysis / visualisation), SQL-extract, figures, finальный отчёт PDF, requirements.txt. + 5-минутное YouTube unlisted видео-разбор. + резюме под 3 junior-вакансии.

Чек-поинт модуля

Basic: Финал трека: self-assessment по 30 can-do statements + mini-investigation на 30 минут + аудит 3 чужих публичных работ.

Pro: + АИ-разбор self-assessment + голосовая защита одного из артефактов трека + карьерный план на 6 месяцев.

[06] WEEKLY ROADMAP · ПЛАН ДЕЙСТВИЙ

26 недель · что и когда ты делаешь

Расписан каждый блок трека: чем занимаешься в каждой неделе и какой артефакт получишь на выходе. План адаптивный — можно идти быстрее, минимум 2 недели на модуль.

Неделя 0FREE

Онбординг

Зачем тебе data analytics

5 видео по 4–7 минут: что такое DA, день из жизни, типы аналитиков, карта трека
3 self-assessment блока: готовность · тип аналитика · 6-месячная цель
Личный манифест на 200–300 слов или 60 секунд голосом — commitment device

Артефакт

Личный манифест в профиле

Недели 1–4FREE

Модуль 1 · бесплатно

Мышление аналитика + Excel

Неделя 1: SMART-вопрос к данным, корреляция vs причинность
Неделя 2: tidy data, типы, даты в ISO, дубликаты и пропуски
Неделя 3: XLOOKUP, SUMIFS, IF/IFS, динамические массивы
Неделя 4: сводные таблицы, Power Query, первый честный график

Артефакт

Мини-исследование (Excel + 1-минутное голосовое)

Недели 5–8

Модуль 2 · первый платный

SQL: разговор с данными

Неделя 5: SELECT, WHERE, ORDER BY, LIMIT, DISTINCT
Неделя 6: WHERE-логика, IN/BETWEEN/LIKE, NULL-логика
Неделя 7: COUNT/SUM/AVG, GROUP BY, HAVING
Неделя 8: INNER и LEFT JOIN, цепочки JOIN-ов, дата-функции

Артефакт

20 SQL-запросов в публичном GitHub Gist

Недели 9–12

Модуль 3

SQL: продвинутый + чистка

Неделя 9: CTE и подзапросы, EXISTS vs IN
Неделя 10: оконные функции — ROW_NUMBER, LAG/LEAD
Неделя 11: SUM OVER, top-N per group, CASE WHEN
Неделя 12: NULL/COALESCE/NULLIF, чистка строк, артефакт

Артефакт

10 SQL-запросов junior+ уровня (когорта, funnel, RFM, MoM)

Недели 13–16

Модуль 4

Визуализация и BI

Неделя 13: принципы Tufte, выбор типа графика, манипуляции
Неделя 14: Looker Studio — первый дашборд от подключения до публикации
Неделя 15: расчётные поля, цвет, visual hierarchy, гештальт
Неделя 16: storytelling, mobile-проверка, Power BI обзор, артефакт

Артефакт

Public Looker Studio dashboard + GitHub README

Недели 17–20

Модуль 5

Статистика для аналитика

Неделя 17: распределения, mean/median/mode, outliers
Неделя 18: sampling, CI через bootstrap, sample size
Неделя 19: гипотезы, p-value, A/B-тест, effect size
Неделя 20: антипаттерны (p-hacking, Simpson, multiple testing), артефакт

Артефакт

A/B Test Investigation Report (PDF + GitHub)

Недели 21–25

Модуль 6 · финал

Python pandas + горизонт инструментов + капстон

Неделя 21: Python-базис, Jupyter, pandas как «новый SQL»
Неделя 22: groupby, merge, очистка, векторизация
Неделя 23: EDA, seaborn, bootstrap и t-test в коде
Неделя 24: когда pandas заканчивается — Polars, DuckDB, PySpark в облаке
Неделя 25: капстон-неделя — финализация репозитория, видео, разбор с экспертом (Pro)

Артефакт

Капстон-проект на GitHub + Notebook 4 «горизонт инструментов» + 5-мин видео + резюме под 3 вакансии

[07] TRACK OUTPUT · ЧТО НА ВЫХОДЕ

Шесть публичных кейсов и капстон в портфолио

Каждый артефакт — публикуется под именем участника на GitHub или Looker Studio. Это не учебные работы внутри платформы — это реальные ссылки, с которыми идёшь на собеседования.

M01 · Модуль 1

Моё первое мини-исследование

Публикуется в

Профиль участника на платформе

M02 · Модуль 2

20 SQL-запросов к e-commerce базе

Публикуется в

GitHub Gist + ссылка в профиле «Вектора»

M03 · Модуль 3

10 SQL-запросов junior+ уровня

Публикуется в

GitHub-репозиторий + ссылка в профиле

M04 · Модуль 4

Public Looker Studio dashboard

Публикуется в

Looker Studio public + GitHub-репозиторий

M05 · Модуль 5

A/B Test Investigation Report

Публикуется в

PDF + GitHub-репозиторий

M06 · Модуль 6

Капстон: полное аналитическое исследование

Публикуется в

GitHub-репо + YouTube unlisted + LinkedIn / hh.ru-резюме

Готов начать

Бесплатный модуль 1 — без регистрации в кошелёк

Месяц до Модуля 2 — бесплатно. Решаешь, идти дальше — оформляешь Basic 1 490 ₽/мес или Pro 2 990 ₽/мес.

Начать модуль 1 ← К обзору трека

[08] LEGAL · РЕЖИМ В

Программа «Данные: мышление и инструменты» — информационно-консультационные услуги по доступу к материалам Платформы «Вектор». Не является образовательной программой по 273-ФЗ. Сертификат участника, выдаваемый по итогам, не является документом об образовании или о квалификации. Темп и результат зависят от участника. Трудоустройство и размер заработной платы не гарантируются.