Термин
LLM judge
Модель-проверяющий, которая оценивает ответ другой модели по заданным критериям.
LLM judge полезен для смысловой проверки ответов, но не должен быть единственным барьером безопасности. Для критичных рисков нужны deterministic checks, allowlist и approval.