Термин

Max tokens

Лимит на количество токенов, которое модель может сгенерировать в ответе.

Max tokens ограничивает длину ответа модели. Слишком маленький лимит может оборвать таблицу, код или JSON, а слишком большой увеличивает стоимость и задержку.