Термин Контекст и память AI Средний

Context engineering

Context engineering - это проектирование всего контекста для LLM: инструкций, данных, памяти, инструментов, RAG, форматов ответа и проверок.

context engineering инженерия контекста context design prompt context design контекстное проектирование context orchestration LLM context management agent context management проектирование контекста LLM сборка контекста агента
Context engineering шире, чем prompt engineering. Промпт - это текст инструкции. Контекст - это все, что модель видит перед ответом: system prompt, запрос пользователя, история диалога, данные из RAG, результаты tool calls, память, ограничения, schema ответа, правила безопасности и текущий state агента.

Главная задача context engineering - дать модели ровно те данные, которые нужны для решения, и убрать то, что мешает. Если контекста мало, модель начинает угадывать. Если контекста слишком много, она теряет фокус, тратит токены, цепляется за устаревшие факты или смешивает разные задачи.

В ИИ-агентах контекст нужно проектировать как рабочую среду. Один узел получает инструкции для классификации, другой - фрагменты базы знаний, третий - результат инструмента и правила approval. Так агент становится предсказуемее, а ошибки легче отлаживать.

Хороший контекст обычно состоит из нескольких слоев: роль и цель, ограничения, актуальные данные, важная память, доступные tools, формат ответа, критерии качества и fallback. Эти слои лучше собирать программно, а не складывать все в один огромный промпт.

Context engineering особенно важен для RAG, long-term memory, multi-agent систем и продуктов с юридическими, финансовыми или клиентскими рисками. Там нужно не только получить красивый ответ, но и понимать, какие источники использовались, какие правила сработали и почему агент выбрал действие.

Примеры

  • Перед ответом поддержки агент получает только актуальный тариф клиента, последние обращения, фрагменты базы знаний и правило, когда нужен handoff.
  • Для SQL-агента в контекст добавляют схему таблиц, column dictionary, ограничения на чтение данных и формат безопасного запроса.
  • В RAG-сценарии модель видит не весь документ, а релевантные chunks с citations и инструкцию не отвечать без источников.
  • Для code review агент получает diff, описание задачи, результаты CI, правила проекта и список файлов, которые нельзя менять.
  • В multi-agent workflow supervisor передает следующему агенту короткий state: цель, что уже сделано, ошибки инструментов и открытые вопросы.
  • После длинного диалога context compression оставляет в prompt только решения, запреты, факты и ссылки на исходные сообщения.

Где используется

  • проектирование системного промпта
  • сборка контекста для ИИ-агента
  • RAG по базе знаний и документам
  • долговременная память и summary memory
  • tool calling и передача результатов инструментов
  • структурированный вывод через JSON schema
  • guardrails и ограничения действий
  • multi-agent workflow и handoff
  • снижение расхода токенов
  • отладка качества через traces и evals

Связанные термины

Частые вопросы

Чем context engineering отличается от prompt engineering?

Prompt engineering работает с формулировкой инструкции. Context engineering проектирует весь набор данных вокруг модели: prompt, память, RAG, tools, state, ограничения и формат ответа.

Почему нельзя просто дать модели больше контекста?

Большой контекст дороже, медленнее и не всегда лучше. Модель может потерять важные детали, использовать устаревшие факты или смешать разные части задачи.

Что входит в хороший контекст агента?

Цель, роль, ограничения, актуальные данные, нужная память, доступные инструменты, результаты проверок, источники, формат ответа и fallback при нехватке данных.

Как context engineering связан с RAG?

RAG отвечает за поиск релевантных фрагментов, а context engineering решает, какие из них положить в prompt, в каком виде, с какими citations и правилами ответа.

Как понять, что контекст собран плохо?

Модель задает лишние вопросы, придумывает факты, игнорирует важные ограничения, отвечает не в том формате или использует старую информацию вместо актуальной.

Как тестировать context engineering?

Нужны evals на типовых сценариях, traces с полным собранным контекстом, проверки источников, тесты на нехватку данных и сравнение разных вариантов сборки prompt.

Где читать дальше

Статьи по теме

Инструменты

Связанные инструменты