practical course edition 02 Anthropic · OpenAI · Google · Microsoft

AI Engineering Roadmap

Практический маршрут по agentic engineering: Claude Code / Cursor workflow, GitHub Copilot, MCP, evals, observability, guardrails и финальный проект, который можно показать как инженерный артефакт.

Длительность
12 недель
Нагрузка
6–10 ч/нед
Формат
Labs + evals
Источники
4 official tracks
§ 00 входная диагностика

Сначала маршрут

Отметьте, что уже уверенно делали руками. Это не экзамен: блок помогает выбрать темп и не тратить неделю на то, что уже стало рабочей привычкой.

Python
Уверенно пишу backend-код, тесты и typed interfaces
FastAPI/Django, pytest, Pydantic, async jobs, API-клиенты, ошибки и retries.
CI/CD
Могу сам собрать pipeline, rollback и production dashboard
GitHub Actions/GitLab CI, Docker, метрики, алерты, canary rollout, runbooks.
AI coding
Регулярно работаю через Claude Code, Cursor или аналоги
Умею просить исследование кодовой базы, план, патч, тесты и ревью результата.
Tools
Понимаю function calling / tools / MCP не только на уровне терминов
Могу описать tool schema, ограничения, права доступа и обработку ошибок.
Evals
Писал eval cases или хотя бы regression suite для LLM-output
Есть понимание dataset, graders, метрик качества, latency/cost budget и PR-gate.
English
Могу читать официальные AI docs и смотреть технические доклады на английском
Не обязательно идеально говорить: важно регулярно потреблять первоисточники.
§ 01 официальные треки

Четыре опоры обучения

Смотрим на agentic engineering через четыре официальные экосистемы: Anthropic для Claude/tool use/evals, OpenAI для production API и Agents SDK, Google для ADK/Gemini, Microsoft/GitHub для enterprise SDLC и governance.

Как использовать четыре трека

  1. AnthropicПроверять prompt quality, tool schemas, eval design и Claude Code habits.
  2. OpenAIСобирать production API loop: tools, graders, safety, deployment и Agents workflow.
  3. GoogleРазобрать ADK, Gemini function calling, code execution, graph workflows и agent evals.
  4. Microsoft/GitHubОформить enterprise SDLC: PR, checks, MCP, Copilot agent, governance и audit trail.
  5. CompareОдин capstone прогнать по всем четырем взглядам и найти расхождения.
  6. RefreshРаз в месяц пересматривать official docs, потому что agent tooling меняется быстро.
§ 02 программа курса

Пять фаз

Каждый урок — самостоятельная страница с материалами, заметками и тестом. Прогресс автоматически сохраняется в браузере. Можно проходить последовательно или в любом порядке.

01
Фаза первая · ≈ 1 неделя
Фундамент
Понять разницу между workflow и agent. Освоить пять базовых паттернов от Anthropic и OpenAI.
0 / 8 завершено 8 часов
02
Фаза вторая · ≈ 1–2 недели
Vibe Coding
Сделать AI-агентов частью ежедневного рабочего инструментария. Claude Code, Cursor, MCP.
0 / 14 завершено параллельно
03
Фаза третья · ≈ 3–4 недели
Production Agents
Здесь ваш CI/CD-бэкграунд даёт огромное преимущество. Evals как тесты, observability как метрики.
0 / 13 завершено основной блок
04
Фаза четвёртая · ≈ 2–3 недели
Frameworks & Multi-Agent
Выбрать один фреймворк и нырнуть глубоко. LangGraph, Pydantic AI, CrewAI и их применение.
0 / 14 завершено углубление
05
Фаза пятая · ≈ 1–2 недели
Deploy & Ops
Это ваша зона. Переносим CI/CD-мышление на LLM-приложения: observability, guardrails, канареечный деплой.
0 / 16 завершено финишная прямая
бонус · опционально
Final Project & Resources
Идеи для финального проекта, подкасты, YouTube, русскоязычные ресурсы и official tracks Anthropic/OpenAI/Google/Microsoft.
0 / 52 завершено capstone
§ 03 12-недельный маршрут

Каждую неделю — артефакт

Главная метрика курса — не количество просмотренных материалов, а то, что осталось в репозитории: правила для агентов, evals, traces, CI-gates и финальный demo.

01

Фундамент

Сравнить workflow vs agent, собрать карту паттернов и словарь терминов.

02

Prompting

Пройти интерактивный tutorial, оформить собственный prompt playbook.

03

Agentic coding

Настроить Claude/Cursor/Copilot правила и решить 2 реальные задачи через agents.

04

Tools + MCP

Собрать минимального Python-агента с tool permissions, MCP boundary и structured outputs.

05

Evals

Написать 20-30 кейсов, базовые graders и первый regression report.

06

Observability

Подключить traces, cost/latency метрики и разбор одного плохого run.

07

Framework

Выбрать LangGraph, OpenAI Agents SDK или Pydantic AI и переписать agent loop.

08

Multi-agent

Сравнить manager-worker, evaluator-optimizer и GitHub handoff подход на одной задаче.

09

Guardrails

Описать dangerous tools, approvals, sandbox, prompt-injection тесты и autonomy levels.

10

GitHub SDLC

Промпты в git, eval suite в PR, CODEOWNERS/rulesets и release notes для model/prompt changes.

11

Capstone

Собрать финальный сервис с README, demo, traces и воспроизводимым setup.

12

Portfolio

Записать demo, оформить архитектуру, limitations, eval report и roadmap v2.

Сначала читаете, что пишут компании. Потом превращаете это в код, evals и операционные привычки. Так курс не превращается в ещё одну папку ссылок.
§ 04 сквозные темы

Материал — по смыслу

Шесть инженерных тем проходят через весь курс. Чтобы не учить одно и то же трижды, у каждой есть «канонический дом» — фаза, где она разбирается подробно. В остальных фазах это recap и применение.

  1. Tool use & MCPДом: фаза 2. Основы — в фазе 1, применение — в 3–4, права и sandbox — в 5.
  2. EvalsДом: фаза 3. Зачем нужны — в фазе 1, в CI на каждый PR — в фазе 5.
  3. ObservabilityДом: фаза 3 (метрики) и фаза 5 (инструмент). В capstone — читаемый trace.
  4. Multi-agentДом: фаза 4. Анти-хайп и безопасностный взгляд — в фазе 5.
  5. Guardrails & safetyДом: фаза 5. Практика в финальном проекте: allowlist, approvals, dry-run.
  6. CI/CD-мышлениеТвой бэкграунд. Превращается в evals-as-tests и cost-as-budget в фазах 3 и 5.