Термин

Latency

Задержка между запросом пользователя и ответом системы.

Latency в AI-агенте складывается из времени модели, retrieval, tools, retries, reviewer-проверок и сети. Для UX важно смотреть не только среднее значение, но и p95 latency.