Термин Контекст и память AI Средний

Context engineering

Context engineering - это проектирование всего контекста для LLM: инструкций, данных, памяти, инструментов, RAG, форматов ответа и проверок.

context engineering инженерия контекста context design prompt context design контекстное проектирование context orchestration LLM context management agent context management проектирование контекста LLM сборка контекста агента

Context engineering шире, чем prompt engineering. Промпт - это текст инструкции. Контекст - это все, что модель видит перед ответом: system prompt, запрос пользователя, история диалога, данные из RAG, результаты tool calls, память, ограничения, schema ответа, правила безопасности и текущий state агента.

Главная задача context engineering - дать модели ровно те данные, которые нужны для решения, и убрать то, что мешает. Если контекста мало, модель начинает угадывать. Если контекста слишком много, она теряет фокус, тратит токены, цепляется за устаревшие факты или смешивает разные задачи.

В ИИ-агентах контекст нужно проектировать как рабочую среду. Один узел получает инструкции для классификации, другой - фрагменты базы знаний, третий - результат инструмента и правила approval. Так агент становится предсказуемее, а ошибки легче отлаживать.

Хороший контекст обычно состоит из нескольких слоев: роль и цель, ограничения, актуальные данные, важная память, доступные tools, формат ответа, критерии качества и fallback. Эти слои лучше собирать программно, а не складывать все в один огромный промпт.

Context engineering особенно важен для RAG, long-term memory, multi-agent систем и продуктов с юридическими, финансовыми или клиентскими рисками. Там нужно не только получить красивый ответ, но и понимать, какие источники использовались, какие правила сработали и почему агент выбрал действие.

Примеры

Перед ответом поддержки агент получает только актуальный тариф клиента, последние обращения, фрагменты базы знаний и правило, когда нужен handoff.
Для SQL-агента в контекст добавляют схему таблиц, column dictionary, ограничения на чтение данных и формат безопасного запроса.
В RAG-сценарии модель видит не весь документ, а релевантные chunks с citations и инструкцию не отвечать без источников.
Для code review агент получает diff, описание задачи, результаты CI, правила проекта и список файлов, которые нельзя менять.
В multi-agent workflow supervisor передает следующему агенту короткий state: цель, что уже сделано, ошибки инструментов и открытые вопросы.
После длинного диалога context compression оставляет в prompt только решения, запреты, факты и ссылки на исходные сообщения.

Где используется

проектирование системного промпта
сборка контекста для ИИ-агента
RAG по базе знаний и документам
долговременная память и summary memory
tool calling и передача результатов инструментов
структурированный вывод через JSON schema
guardrails и ограничения действий
multi-agent workflow и handoff
снижение расхода токенов
отладка качества через traces и evals

Связанные термины

Agent state Agent trace Chunking Citation в ответе AI Context compression Conversation context Evals Guardrails

Частые вопросы

Чем context engineering отличается от prompt engineering?

Prompt engineering работает с формулировкой инструкции. Context engineering проектирует весь набор данных вокруг модели: prompt, память, RAG, tools, state, ограничения и формат ответа.

Почему нельзя просто дать модели больше контекста?

Большой контекст дороже, медленнее и не всегда лучше. Модель может потерять важные детали, использовать устаревшие факты или смешать разные части задачи.

Что входит в хороший контекст агента?

Цель, роль, ограничения, актуальные данные, нужная память, доступные инструменты, результаты проверок, источники, формат ответа и fallback при нехватке данных.

Как context engineering связан с RAG?

RAG отвечает за поиск релевантных фрагментов, а context engineering решает, какие из них положить в prompt, в каком виде, с какими citations и правилами ответа.

Как понять, что контекст собран плохо?

Модель задает лишние вопросы, придумывает факты, игнорирует важные ограничения, отвечает не в том формате или использует старую информацию вместо актуальной.

Как тестировать context engineering?

Нужны evals на типовых сценариях, traces с полным собранным контекстом, проверки источников, тесты на нехватку данных и сравнение разных вариантов сборки prompt.

Где читать дальше

Статьи по теме

Пошаговые инструкции 10 мин

Claude Fable 5 vs обычный чат: когда нужна сильная модель

Практический разбор: когда хватает обычного чата, а когда нужна сильная модель вроде Claude Fable 5 из-за длинного контекста, рассуждения и аккуратности.

LLM Claude контекст

Пошаговые инструкции 11 мин

Как сделать редактора статей на Claude Fable 5

Практическая инструкция: как сделать редактора статей на Claude Fable 5 — план, структура, простое объяснение, проверка логики и FAQ.

промпты Claude SEO

Пошаговые инструкции 12 мин

Claude Fable 5 для работы с базой знаний компании

Практическая инструкция: как использовать Claude Fable 5 для базы знаний компании — поиск ответов, пересборка статей и выявление устаревших документов.

RAG Claude база знаний

Основы AI 7 мин

Что такое context engineering и почему одного промпта мало

Простыми словами: что такое context engineering, почему одного промпта мало и как правильный контекст помогает LLM, RAG и AI-агентам отвечать точнее.

RAG AI-агенты prompt engineering

AI-агенты 13 мин

Что такое guardrails в ИИ и зачем они нужны агентам

Простое объяснение guardrails: какие проверки нужны вокруг ИИ, чем они отличаются от системного промпта, как защищают RAG, tools, память и ответы агента.

AI-агенты Guardrails Prompt injection

Промпты 13 мин

Что такое системный промпт и зачем он нужен ИИ-ассистенту

Простое объяснение системного промпта: чем он отличается от пользовательского запроса, как задает роль, формат, RAG, tools, память, безопасность и guardrails.

AI-агенты Guardrails Prompt injection

Инструменты

Связанные инструменты

Оплата по использованию токенов Anthropic Claude API

API моделей Claude для AI-приложений: текст, reasoning, длинный контекст, анализ документов, tool use, агенты и production-интеграции.

Бесплатный старт + оплата по использованию Claude

Семейство моделей Anthropic Claude для анализа больших документов, аккуратной редакции, ресерча, кода и рабочих ассистентов.

Open-source / cloud Flowise

Визуальный low-code builder для LLM-приложений: Agentflow V2, chatflows, RAG, Document Stores, tools, API, embed и self-hosted запуск.

Open-source / cloud costs Google ADK

Open-source фреймворк Google для code-first AI-агентов: tools, state, memory, multi-agent workflows, evals, tracing и deploy в Google Cloud.

Usage-based / Google AI Google Gemini API

Google Gemini API - API для подключения моделей Gemini к приложениям, AI-агентам, чат-ботам и автоматизациям. Подходит для текста, изображений, файлов, structured output и tool calling.

Open-source and paid platform LangChain

Фреймворк для LLM-приложений, chains, agents, RAG, tools и context orchestration.