Термин

LLM judge

Модель-проверяющий, которая оценивает ответ другой модели по заданным критериям.

LLM judge полезен для смысловой проверки ответов, но не должен быть единственным барьером безопасности. Для критичных рисков нужны deterministic checks, allowlist и approval.