Термин
Max tokens
Лимит на количество токенов, которое модель может сгенерировать в ответе.
Max tokens ограничивает длину ответа модели. Слишком маленький лимит может оборвать таблицу, код или JSON, а слишком большой увеличивает стоимость и задержку.