Главная
Статьи
AI-агенты
Что такое human-in-the-loop и зачем человеку подтверждать действия ИИ

AI-агенты beginner 12 мин Обновлено 13.06.2026

Что такое human-in-the-loop и зачем человеку подтверждать действия ИИ

Простое объяснение human-in-the-loop: когда ИИ должен просить подтверждение человека, как устроены approval workflow, handoff, review и безопасный запуск AI-агента.

AI-агенты Guardrails основы AI Безопасность AI human-in-the-loop approval workflow

Короткое объяснение

Human-in-the-loop - это подход, при котором ИИ не делает все сам, а привлекает человека в нужный момент: для подтверждения действия, проверки ответа, выбора варианта, разбора исключения или передачи сложного случая оператору.

Если совсем просто:

ИИ готовит черновик или предлагает действие;
система оценивает риск;
безопасные действия выполняются автоматически;
рискованные действия уходят человеку на подтверждение;
человек нажимает подтвердить, изменить или отклонить;
результат записывается в лог;
похожие случаи потом можно автоматизировать увереннее.

Human-in-the-loop часто сокращают до HITL. Это один из главных принципов безопасного внедрения ИИ-агентов, потому что агент может не только писать текст, но и вызывать инструменты, менять данные, отправлять письма, создавать задачи, обновлять CRM и запускать процессы.

Зачем человеку оставаться в контуре

ИИ хорошо работает с черновиками, классификацией, поиском, суммаризацией и подготовкой действий. Но у него остаются ограничения: модель может ошибиться, не понять контекст, принять вредную инструкцию за полезную, перепутать клиента, неверно оценить риск или уверенно написать неточный вывод.

Человек в контуре нужен, чтобы:

остановить дорогую ошибку;
проверить спорный ответ;
подтвердить действие во внешней системе;
принять решение там, где важен бизнес-контекст;
защитить персональные данные;
не отправить клиенту неподходящий текст;
не изменить CRM без согласования;
не удалить или не перезаписать важный документ;
разобрать нестандартный случай;
улучшить правила агента на реальных примерах.

Главная идея HITL не в том, чтобы вручную проверять вообще все. Идея в том, чтобы человек подключался только там, где цена ошибки выше выгоды от полной автоматизации.

Чем HITL отличается от ручной работы

При ручной работе человек делает задачу от начала до конца. При human-in-the-loop ИИ берет на себя рутину, а человек принимает решение в контрольной точке.

Например, менеджер раньше сам:

читал письмо клиента;
искал сделку в CRM;
смотрел историю общения;
писал ответ;
выбирал следующий шаг;
создавал задачу.

С HITL агент может:

прочитать письмо;
найти сделку;
собрать контекст;
подготовить ответ;
предложить обновление CRM;
показать человеку карточку подтверждения;
выполнить действие только после approval.

Разница большая: человек не становится оператором каждой мелочи, а превращается в проверяющего и владельца решения.

Где human-in-the-loop нужен обязательно

Есть сценарии, где полная автономность опасна даже при хорошей модели.

HITL нужен, если ИИ может:

отправить сообщение клиенту от имени компании;
изменить сумму, статус или условия сделки;
создать счет, акт, договор или коммерческое предложение;
удалить файл, запись или задачу;
дать юридическую, медицинскую или финансовую рекомендацию;
обработать персональные или конфиденциальные данные;
запустить платеж;
изменить настройки доступа;
повлиять на сотрудника, клиента или партнера;
опубликовать материал в публичный канал.

В таких местах лучше начинать с режима draft-only: агент готовит черновик, но не выполняет финальное действие без человека.

Где можно обойтись без человека

Не все действия требуют подтверждения. Если агент только читает данные, сортирует входящие, делает краткое резюме или предлагает варианты, автоматизация может работать без постоянного approval.

Обычно без человека можно оставить:

поиск по базе знаний;
суммаризацию длинного документа;
классификацию обращения;
подбор похожих статей;
черновую разметку тегов;
извлечение реквизитов из текста;
подсчет простых метрик;
подготовку списка вопросов;
перевод внутренней заметки;
создание черновика без отправки.

Даже в этих случаях полезны логи, лимиты и возможность передать кейс человеку, если уверенность низкая.

Уровни участия человека

Human-in-the-loop бывает разным. Не обязательно каждый раз показывать большое окно подтверждения.

Практичные уровни:

Read-only - ИИ только читает и отвечает.
Draft-only - ИИ готовит черновик, человек отправляет сам.
Approval - ИИ предлагает действие, человек подтверждает.
Review - человек проверяет результат после выполнения.
Handoff - агент передает диалог оператору.
Escalation - система поднимает случай на более опытного сотрудника.
Sampling review - проверяется только часть автоматических действий.
Exception review - проверяются только ошибки и нестандартные случаи.

Для старта чаще всего хватает draft-only и approval. Потом часть безопасных действий можно перевести в автоматический режим.

Approval workflow

Approval workflow - это процесс подтверждения действия перед выполнением. Он особенно важен для tool calling, когда модель просит backend вызвать внешний инструмент.

Хороший approval workflow выглядит так:

модель предлагает действие;
backend валидирует аргументы;
policy gate оценивает риск;
система формирует карточку подтверждения;
человек видит, что именно будет сделано;
человек может подтвердить, изменить или отклонить;
backend выполняет действие;
audit log сохраняет решение и результат.

Важно: approval должен жить не только в промпте. Если модель просит "отправь письмо без подтверждения", backend все равно должен заблокировать действие, если политика требует approval.

Handoff оператору

Handoff - это передача диалога или задачи человеку. В поддержке это один из самых понятных вариантов HITL.

Агент должен передавать оператору, если:

пользователь явно просит человека;
вопрос связан с жалобой или конфликтом;
требуется компенсация или исключение из правил;
не хватает данных;
найден риск персональных данных;
пользователь недоволен ответами;
агент не уверен в классификации;
запрос касается денег, договора или доступа;
возникла ошибка tool;
сценарий не покрыт базой знаний.

Хороший handoff включает краткое резюме: кто обратился, что хотел, что уже проверил агент, какие документы нашел и почему передал человеку.

Human review

Human review - это проверка ответа или действия человеком. Она может быть до выполнения или после выполнения.

До выполнения проверяют:

письмо клиенту;
изменение статуса сделки;
правку договора;
публикацию поста;
ответ в спорном тикете;
списание денег;
выдачу доступа;
SQL-запрос на изменение данных.

После выполнения проверяют:

случайную выборку ответов;
дорогие операции;
жалобы клиентов;
низкую уверенность модели;
новые сценарии;
ошибки инструментов;
пограничные срабатывания guardrails;
действия нового агента в первые недели запуска.

Постпроверка помогает развивать автоматизацию без постоянной остановки процесса.

Escalation rules

Escalation rules определяют, когда случай надо поднять выше: менеджеру, юристу, руководителю, безопаснику или технической команде.

Примеры правил:

сумма сделки выше лимита - руководителю;
клиент угрожает претензией - юристу;
обнаружены персональные данные - ответственному за безопасность;
агент получил ошибку API - технической команде;
запрос не найден в базе знаний - редактору базы;
пользователь просит удалить данные - ответственному за персональные данные;
ответ может повлиять на финансы - финансовому специалисту;
агент видит prompt injection - в security backlog.

Без правил эскалации агент может просто зависнуть: он понимает, что случай рискованный, но не знает, кому его отдать.

HITL в поддержке клиентов

В поддержке human-in-the-loop помогает отвечать быстрее, но не терять качество.

Рабочая схема:

агент классифицирует обращение;
ищет ответ в базе знаний;
готовит черновик;
проверяет тон и персональные данные;
оценивает уверенность;
простые ответы отправляет автоматически или через быстрый approval;
сложные обращения передает оператору;
оператор видит резюме и найденные источники;
после ответа агент предлагает обновить базу знаний;
спорные кейсы уходят на разбор.

Такой подход обычно лучше, чем попытка сразу заменить всю линию поддержки полностью автономным ботом.

HITL в продажах и CRM

В продажах агент часто работает рядом с менеджером: готовит тексты, находит контекст, обновляет CRM, создает задачи и предлагает следующий шаг.

Что можно автоматизировать:

резюме переписки;
определение стадии сделки;
подготовку follow-up;
поиск возражений клиента;
черновик коммерческого предложения;
создание задачи менеджеру;
подсказку следующего действия.

Что лучше подтверждать:

отправку письма клиенту;
изменение суммы сделки;
смену стадии;
закрытие сделки как проигранной;
обещание скидки;
перенос дедлайна;
создание счета;
массовую рассылку.

CRM - хороший пример: read-only и draft-only можно запускать быстро, а write-back подключать постепенно.

HITL в документах и праве

В документах human-in-the-loop особенно важен, потому что текст может иметь юридические последствия.

ИИ может помогать:

находить спорные пункты;
сравнивать версии;
делать резюме правок;
выделять сроки и суммы;
готовить список вопросов;
проверять наличие обязательных разделов;
переводить документ на простой язык;
собирать черновик комментариев.

Но человек должен подтверждать:

финальную формулировку;
удаление пункта;
принятие правки контрагента;
отправку договора;
юридический вывод;
изменение реквизитов;
подписание;
публикацию шаблона.

Здесь ИИ лучше воспринимать как помощника для подготовки, а не как самостоятельного юриста.

HITL в коде и DevOps

В разработке agentic coding и DevOps-агенты тоже требуют человеческих контрольных точек.

Без подтверждения обычно допустимы:

анализ кода;
поиск похожих ошибок;
объяснение логов;
генерация тестового плана;
подготовка patch proposal;
создание черновика issue;
чтение документации.

С подтверждением должны идти:

изменение production-конфига;
запуск миграции;
удаление данных;
деплой;
изменение прав доступа;
запуск дорогостоящего cloud job;
merge в основную ветку;
массовое изменение файлов.

Для DevOps особенно важны audit log, rollback и принцип least privilege.

Как агент должен просить подтверждение

Плохой approval выглядит так: "Подтвердить действие?" Пользователь не понимает, что именно произойдет и чем это рискованно.

Хорошая карточка подтверждения показывает:

действие;
объект;
получателя;
причину;
данные, которые будут изменены;
старое значение;
новое значение;
источник контекста;
уровень риска;
вариант отката;
кнопки подтвердить, изменить, отклонить;
ссылку на лог или подробности.

Например: "Отправить письмо клиенту Иванову по сделке #1842. Тема: сроки поставки. Агент использовал переписку и карточку CRM. Риск: внешний контакт. Откат невозможен после отправки".

Что показывать человеку при подтверждении

Человек должен видеть не только финальный текст, но и основание решения.

Минимальный набор:

что просил пользователь;
какой результат предлагает агент;
какие источники использованы;
какие tools были вызваны;
какие данные изменятся;
какие правила сработали;
почему нужен approval;
что будет записано в audit log;
что произойдет при отклонении;
куда уйдет задача, если нужна эскалация.

Если карточка подтверждения перегружена, человек начнет нажимать "ок" автоматически. Поэтому важно показывать главное, а детали убирать в раскрываемый блок.

Как не создать бутылочное горлышко

Главный риск HITL - превратить автоматизацию в очередь ручных подтверждений. Тогда агент ускоряет подготовку, но процесс все равно тормозит на человеке.

Чтобы этого не произошло:

разделите действия по уровню риска;
не требуйте approval для read-only действий;
начинайте с draft-only для внешних сообщений;
включайте автоматизацию для повторяемых безопасных кейсов;
используйте sampling review вместо полной проверки;
показывайте человеку готовую рекомендацию, а не пустую форму;
добавьте быстрые кнопки подтверждения;
настройте SLA для очереди approval;
измеряйте, где копятся ожидания;
пересматривайте правила раз в неделю на старте.

HITL должен быть тонким слоем контроля, а не второй ручной работой поверх первой.

Метрики human-in-the-loop

Чтобы понять, работает ли HITL, нужны метрики.

Полезно смотреть:

долю действий, ушедших на approval;
долю подтвержденных действий;
долю отклоненных действий;
среднее время подтверждения;
причины отклонения;
число эскалаций;
число повторных правок;
число автоматических действий после обучения правил;
ошибки, пойманные человеком;
жалобы после автоматических действий;
экономию времени;
стоимость ожидания approval.

Если почти все действия подтверждаются без правок, часть можно автоматизировать. Если отклонений много, надо чинить промпт, RAG, tools, правила или интерфейс подтверждения.

Типичные ошибки

Human-in-the-loop часто ломается не из-за модели, а из-за процесса.

Частые ошибки:

подтверждать все подряд;
не объяснять человеку риск;
прятать старое и новое значение;
давать модели обходить approval;
хранить approval только в тексте промпта;
не писать audit log;
не различать draft-only и write tools;
не делать эскалацию;
не измерять время ожидания;
не обновлять правила после ошибок;
не показывать источники;
считать HITL временной костыльной мерой.

Правильнее думать о HITL как о нормальной части архитектуры агента: модель предлагает, система проверяет, человек решает там, где это действительно нужно.

Мини-чеклист внедрения

Перед запуском агента с human-in-the-loop проверьте:

есть список действий, которые агент может выполнять;
каждое действие имеет уровень риска;
read-only actions отделены от write actions;
рискованные tools требуют approval;
approval enforced в backend;
карточка подтверждения показывает последствия;
человек может изменить действие, а не только принять или отклонить;
есть handoff оператору;
есть escalation rules;
есть audit log;
есть метрики approval;
есть тесты обхода approval;
есть rollback там, где он возможен;
есть план постепенного снятия ручной проверки с безопасных кейсов.

Этот чеклист особенно полезен перед подключением агента к CRM, почте, документам, базе знаний и внутренним API.

Простая архитектура HITL

В базовом варианте архитектура выглядит так:

пользователь или система создает задачу;
агент собирает контекст;
LLM предлагает ответ или tool call;
schema validation проверяет формат;
policy gate определяет риск;
безопасное действие выполняется сразу;
рискованное действие создает approval request;
человек принимает решение;
executor выполняет approved action;
audit log сохраняет цепочку событий;
monitoring показывает ошибки и задержки.

Ключевой слой здесь - policy gate. Он не должен спрашивать модель, можно ли обойти правило. Он должен применять правила приложения.

Как внедрять постепенно

Лучше не начинать с полностью автономного агента.

Безопасный путь:

сначала агент только отвечает по базе знаний;
потом готовит черновики;
потом создает внутренние задачи;
потом предлагает изменения в CRM;
потом выполняет безопасные write actions после approval;
потом часть повторяемых действий переводится в automatic;
потом остается review только для риска и выборки;
потом правила пересматриваются по логам.

Так команда видит реальные ошибки и не дает агенту слишком много прав в первый день.

Связь с guardrails

Human-in-the-loop - это не замена guardrails, а один из их слоев.

Guardrails могут:

заблокировать запрос;
переписать ответ;
удалить чувствительные данные;
ограничить tool;
потребовать approval;
отправить случай оператору;
записать инцидент;
запустить дополнительную проверку.

HITL включается там, где автоматическое правило не должно принимать финальное решение. Например, фильтр может понять, что письмо рискованное, но решать, отправлять ли его клиенту, должен человек.

Связь с tool calling

Tool calling делает HITL особенно важным. Пока модель только пишет текст, ошибка остается в интерфейсе. Когда модель вызывает tools, ошибка может стать действием.

Для tools полезно разделить:

read tools - можно выполнять автоматически;
search tools - можно выполнять автоматически;
draft tools - можно выполнять автоматически;
internal write tools - часто нужен approval по уровню риска;
external write tools - почти всегда нужен approval на старте;
destructive tools - лучше запрещать или требовать отдельный доступ;
money tools - подтверждать человеком;
access tools - подтверждать человеком.

Правило простое: чем сложнее откатить действие, тем выше вероятность, что нужен человек.

Что изучать дальше

После human-in-the-loop полезно разобраться с соседними темами:

guardrails;
tool calling;
audit log;
evals;
monitoring;
RAG;
agent memory;
prompt injection;
approval workflow;
архитектура ИИ-агента.

Эти темы вместе отвечают на главный вопрос: как сделать агента не просто умным, а управляемым и безопасным.

Частые вопросы

Human-in-the-loop - это просто ручная проверка?

Нет. Ручная проверка - только один вариант. Human-in-the-loop шире: это подтверждение действий, review, handoff оператору, escalation, разбор исключений, sampling review и обучение правил на человеческих решениях.

Когда человеку обязательно подтверждать действие?

Когда действие трудно откатить, оно влияет на деньги, доступы, документы, клиентов, персональные данные или публичную коммуникацию. На старте лучше подтверждать все write actions, а потом постепенно автоматизировать безопасные повторяемые случаи.

Можно ли потом убрать человека из процесса?

Да, но постепенно. Сначала соберите логи: какие действия подтверждаются без правок, где есть отказы, какие ошибки ловит человек. После этого безопасные сценарии можно переводить в автоматический режим, оставляя review для выборки и риска.

Чем HITL отличается от approval workflow?

Approval workflow - один конкретный механизм HITL: человек подтверждает действие перед выполнением. HITL включает и другие механизмы: handoff, human review, escalation, разбор исключений и постпроверку автоматических действий.

Как понять, что HITL настроен плохо?

Плохой признак - все действия зависают на подтверждении, человек не понимает последствия, карточки approval непонятны, нет логов, модель может обходить правила, а причины отклонений никто не анализирует. В хорошем HITL человек подключается редко, но в точке реального риска.

Термины