Три слоя: модель,
провайдер, интерфейс
Когда вы открываете ChatGPT или Claude — вам кажется, что это одна штука. На самом деле это три отдельных слоя, каждый из которых можно заменить независимо. Понимание этого даёт свободу выбора и убирает «магию».
Это то, что вы видите и с чем работаете. Интерфейс принимает ваш текст, отправляет запрос к провайдеру и показывает ответ. Один и тот же Claude Sonnet 4.6 вы можете вызвать через браузер, VS Code, мобильное приложение или написав две строчки Python.
Выбор интерфейса влияет на удобство и возможности, но не на саму модель. В VS Code вы можете давать модели прямой доступ к файлам проекта — в браузерном чате нет.
Провайдер — это компания или система, которая хранит веса модели, запускает инференс на своих серверах и даёт вам API. Именно провайдер выставляет счёт за токены, обеспечивает uptime и устанавливает политику работы с данными.
Одну и ту же модель могут предоставлять несколько провайдеров: GPT-4o доступен через OpenAI напрямую, через Azure, через OpenRouter. Цена и условия могут отличаться. OpenRouter — агрегатор, который даёт единый API к 300+ моделям от разных провайдеров.
Это собственно нейронная сеть: миллиарды чисел (весов), которые были обучены на данных. Модель определяет, насколько умные ответы вы получаете. Одна модель фиксирована — вы не можете изменить её веса простым запросом.
Модели различаются по размеру (7B, 70B, 1T параметров), специализации (код, рассуждение, мультимодальность), размеру контекстного окна и дате среза знаний.
Обзор инструментов
Экосистема инструментов выросла быстро. Разберём её по категориям — от простейшего чата до автономных агентов, которые работают без вашего участия.
Все сотрудники. Не требует технических знаний. Лучший старт для большинства задач.
- Не требует установки — работает в браузере
- Загрузка файлов (PDF, изображения, таблицы)
- Projects — постоянный контекст для команд
- Встроенная память между сессиями
- Готовые интеграции: поиск, генерация кода
- Нет автоматизации без ручного ввода
- Лимиты сообщений на бесплатном тарифе
- Меньше гибкости по выбору модели и провайдера
VS Code — это платформа, а не просто редактор. В неё встраиваются три типа LLM-инструментов одновременно, и именно их комбинация даёт максимум.
Инлайн-подсказки, чат, автодополнение прямо в редакторе. Простейший вход — установил расширение и работает.
Это уже не просто "спросить модель". Roo Code и Cline дают агенту полный доступ к проекту: читать/писать файлы, запускать команды, работать в цикле. Можно тонко настраивать пайплайны, роли (architect/coder/reviewer), контекстные правила через .clinerules / .roo. Поддерживают любую модель через OpenRouter — не привязаны к одному провайдеру.
Большинство CLI-агентов имеют VS Code интеграцию — запускаются прямо из встроенного терминала или через отдельный extension. Вы получаете и IDE-удобство, и мощь CLI.
CLI-агент запускается в терминале внутри вашего проекта. Он видит файлы, выполняет команды, вызывает MCP-инструменты. Именно здесь начинается автоматизация без написания кода.
- Запускается прямо в проекте — видит все файлы
- Выполняет bash, git, npm и любые команды
- MCP-интеграции: Linear, Notion, Slack, GitHub
- Автоматизация через скрипты и cron без GUI
- Идеально для CI/CD — без интерфейса
- Нужен терминал и базовые знания CLI
- Требует авторизации — API-ключ или OAuth (корп. подписка)
- Выше порог входа для нетехнических ролей
Отдельная категория: инструменты, которые не встраиваются в IDE, а работают как самостоятельные агентские системы. Они принимают высокоуровневую задачу и выполняют её — сами планируя шаги, вызывая инструменты, итерируя.
Агентный фреймворк с открытым кодом. Поддерживает любые модели, сложные multi-agent пайплайны, инструменты. Используется как основа в нескольких продакшен-проектах. Хорошо интегрируется с MCP.
Оркестратор агентов с акцентом на надёжность и долгие задачи. Поддерживает чекпоинты, логирование, восстановление после ошибок — важно для production.
CLI-агент — это интерактив: вы рядом, даёте команды. Автономный агент — это запустил и ушёл: задача выполняется пока вас нет, с логами и уведомлениями по завершении.
- Полный контроль над запросом и параметрами
- Системный промпт, инструменты, батчинг
- Встраивается в любой продукт
- Batch API для массовой обработки
- Один ключ — 300+ моделей (Claude, GPT, DeepSeek…)
- Бесплатные модели: Gemma 4, Nemotron
- Авто-роутинг к лучшей/дешёвой модели
- Единый биллинг вместо 5 аккаунтов
Как устроен запрос
Каждый раз, когда вы отправляете сообщение, запускается цепочка из нескольких шагов. Понимание этой цепочки объясняет, почему одни вещи работают именно так, а другие не работают вообще.
→ user: [история]
→ user: "Ваш вопрос"
→ Authorization: Bearer sk-ant-...
→ стриминг или ожидание
→ ответ добавлен в контекст
Уход от «просто чата»
Большинство людей использует LLM как улучшенный поиск: написали вопрос — получили ответ — скопировали. Это рабочий подход, но он оставляет 90% возможностей за бортом.
Переход от чата к агентному режиму — это главный сдвиг. Он происходит когда:
Как выбрать инструмент
Правильный выбор инструмента зависит от двух вещей: что вы хотите сделать и какой у вас технический уровень. Ответьте на вопросы — получите рекомендацию.