Термин
Контекстный бюджет
План распределения токенов между system prompt, данными пользователя, RAG-фрагментами, tools и ответом модели.
Контекстный бюджет помогает не переполнять context window и не отправлять модели лишние данные. В нем заранее резервируют токены под ответ, tools, retrieved chunks и историю диалога.