Термин
Latency
Задержка между запросом пользователя и ответом системы.
Latency в AI-агенте складывается из времени модели, retrieval, tools, retries, reviewer-проверок и сети. Для UX важно смотреть не только среднее значение, но и p95 latency.