Главная
Статьи
Пошаговые инструкции
Как подключить инструменты к ИИ-агенту: tool calling без хаоса

Пошаговые инструкции advanced 25 мин Обновлено 22.05.2026

Как подключить инструменты к ИИ-агенту: tool calling без хаоса

Пошаговая инструкция по tool calling для ИИ-агента: tool registry, JSON Schema, backend executor, validation, policy gate, idempotency, approval, audit log и evals.

AI-агенты tool calling audit log Инструкция function calling JSON Schema human approval backend validation

Что получится в результате

Соберем безопасный контур tool calling для ИИ-агента. Модель будет не выполнять действия напрямую, а предлагать tool call в строгом формате. Backend проверит JSON schema, права пользователя, политику инструмента, лимиты, idempotency, риск действия и только потом выполнит tool или отправит действие на approval.

В результате будет рабочий MVP:

инструменты описаны в `tool_registry`;
версии схем хранятся в `tool_schema_versions`;
права на tools лежат в `tool_policy`;
входные аргументы проверяются в `tool_argument_checks`;
каждый запрос модели сохраняется в `model_call_log`;
предложенные tool calls пишутся в `tool_call_candidates`;
backend-решение пишется в `policy_gate_log`;
выполнение tools идет через `tool_execution_queue`;
результаты tools сохраняются в `tool_result_log`;
retries пишутся в `tool_retry_log`;
идемпотентность контролируется через `idempotency_keys`;
опасные действия идут через `approval_queue`;
все внешние API calls пишутся в `external_api_log`;
ошибки tools пишутся в `error_log`;
стоимость и задержка пишутся в `cost_log` и `latency_log`;
тесты tools лежат в `tool_eval_cases`;
результаты тестов пишутся в `tool_eval_runs`;
все решения фиксируются в `audit_log`.

Первая версия должна подключить 2-3 простых инструмента: read-only поиск, создание черновика задачи и действие с approval. Этого достаточно, чтобы проверить всю архитектуру без риска.

Что понадобится

Минимальный набор:

один ИИ-агент;
модель с поддержкой tool calling или structured output;
backend, который исполняет tools;
база для реестра tools, логов и очередей;
JSON Schema для каждого инструмента;
список ролей пользователей;
policy gate перед выполнением tools;
approval для опасных действий;
тестовый API или sandbox;
20-40 тестовых сценариев.

Для первого запуска возьмите три инструмента: `search_knowledge_base`, `create_task_draft`, `send_email`. Первые два можно разрешить в ограниченном режиме, а `send_email` сразу сделать `approval_required`.

Шаг 1. Выберите один сценарий MVP

Не подключайте все API компании сразу.

Хорошие первые сценарии:

поиск ответа в базе знаний;
чтение карточки CRM;
создание черновика задачи;
создание черновика письма;
проверка статуса заказа;
расчет стоимости доставки;
поиск файла;
создание заявки на согласование;
обновление безопасного служебного поля;
отправка уведомления внутри команды.

Для этой инструкции берем сценарий: агент отвечает клиенту, ищет информацию в базе знаний, при необходимости создает черновик задачи менеджеру и готовит письмо, но не отправляет его без approval.

Проверка: первый MVP не имеет tool, который удаляет данные или отправляет деньги.

Шаг 2. Разделите tools по риску

Создайте классы риска до написания кода.

Классы:

`read_only` - только чтение данных;
`draft_only` - создание черновика без внешнего эффекта;
`write_internal` - изменение внутренней системы;
`send_message` - отправка сообщения человеку;
`external_write` - действие во внешнем сервисе;
`payment` - деньги, возвраты, счета;
`delete` - удаление данных;
`permission_change` - права доступа и публичные ссылки.

Правило для MVP:

`read_only` можно выполнять после проверки доступа;
`draft_only` можно выполнять после schema validation;
`write_internal` только через approval;
`send_message`, `payment`, `delete`, `permission_change` не выполнять напрямую.

Проверка: у каждого tool есть риск до того, как он появился в prompt.

Шаг 3. Создайте `tool_registry`

`tool_registry` - реестр всех инструментов.

Колонки:

id
tool_name
display_name
description
tool_type
risk_level
side_effect_type
owner
is_active
created_at
updated_at

Стартовые инструменты:

search_knowledge_base | Поиск по базе знаний | retrieval | low | read_only
read_customer_profile | Чтение клиента | api | medium | read_only
create_task_draft | Черновик задачи | api | medium | draft_only
send_email | Отправка письма | api | high | send_message
update_crm_field | Обновление CRM | api | high | write_internal

Проверка: tool не может использоваться агентом, если его нет в `tool_registry` или `is_active = false`.

Шаг 4. Версионируйте схемы tools

Создайте `tool_schema_versions`.

Колонки:

id
tool_name
schema_version
input_schema_json
output_schema_json
status
created_at

Пример `search_knowledge_base`:

{
  "type": "object",
  "additionalProperties": false,
  "required": ["query", "top_k"],
  "properties": {
    "query": {"type": "string", "minLength": 3, "maxLength": 500},
    "top_k": {"type": "integer", "minimum": 1, "maximum": 10},
    "filters": {"type": "object"}
  }
}

Проверка: изменение схемы создает новую версию, а не ломает старые traces.

Шаг 5. Опишите `tool_policy`

`tool_policy` решает, кто и когда может вызвать tool.

Колонки:

id
tool_name
role
condition_json
allow_call
requires_approval
max_calls_per_run
max_payload_size
is_active

Пример:

search_knowledge_base | any | {} | yes | no | 10 | 20kb
read_customer_profile | support | {"same_account":true} | yes | no | 5 | 20kb
create_task_draft | support | {} | yes | no | 3 | 50kb
send_email | support | {"recipient_verified":true} | yes | yes | 1 | 50kb
delete_customer | any | {} | no | yes | 0 | 0

Проверка: модель может предложить `delete_customer`, но backend всегда вернет block.

Шаг 6. Сделайте backend executor

Модель не должна сама ходить в API. Она возвращает намерение вызвать tool, а backend исполняет.

Компоненты:

`tool_call_parser` - извлекает tool name и arguments;
`schema_validator` - проверяет JSON Schema;
`policy_gate` - проверяет права и риск;
`executor` - вызывает реальный код;
`result_normalizer` - приводит результат к схеме;
`audit_logger` - пишет решения;
`retry_manager` - управляет повторами;
`approval_manager` - отправляет опасное действие на согласование.

Проверка: даже если модель "уверена", без backend executor tool не выполняется.

Шаг 7. Логируйте model calls

Создайте `model_call_log`.

Колонки:

id
run_id
provider
model_id
prompt_version
input_tokens
output_tokens
status
latency_ms
created_at

Логируйте:

модель;
prompt version;
входные и выходные токены;
latency;
finish reason;
был ли tool call;
ошибку, если модель не ответила.

Проверка: можно понять, какая модель предложила неправильный tool.

Шаг 8. Сохраняйте tool call candidates

Создайте `tool_call_candidates`.

Колонки:

id
run_id
model_call_id
tool_name
arguments_json
arguments_hash
confidence
status
created_at

Статусы:

`proposed`;
`schema_failed`;
`blocked_by_policy`;
`waiting_approval`;
`queued`;
`executed`;
`failed`;

Проверка: предложенный model tool call сохраняется до выполнения, чтобы его можно было расследовать.

Шаг 9. Валидируйте аргументы

Создайте `tool_argument_checks`.

Колонки:

id
run_id
candidate_id
tool_name
schema_version
is_valid
errors_json
normalized_arguments_json
created_at

Проверяйте:

обязательные поля;
типы данных;
enum values;
минимумы и максимумы;
формат email;
формат даты;
размер payload;
отсутствие лишних полей;
принадлежность resource_id пользователю;
отсутствие prompt injection в строковых аргументах.

Проверка: arguments с лишним полем `send_now=true` не проходят validation, если поле не описано в schema.

Шаг 10. Добавьте policy gate

Создайте `policy_gate_log`.

Колонки:

id
run_id
candidate_id
tool_name
user_id
role
policy_result
matched_policy_id
requires_approval
block_reason
created_at

Policy gate проверяет:

tool активен;
роль пользователя разрешена;
user имеет доступ к ресурсу;
лимит вызовов не превышен;
risk level допустим;
side effect разрешен;
approval нужен или нет;
cost limit не превышен;
idempotency key есть для write-действий;
tool не запрещен в текущем workflow.

Проверка: backend блокирует tool до executor, если правило не прошло.

Шаг 11. Настройте idempotency

Идемпотентность нужна, чтобы retry не создал две задачи или два письма.

Создайте `idempotency_keys`.

Колонки:

id
idempotency_key
run_id
tool_name
arguments_hash
status
result_ref
created_at
expires_at

Правила:

для write-действий idempotency key обязателен;
key строится из run_id, tool_name и normalized arguments hash;
повтор с тем же key возвращает старый результат;
key имеет TTL;
разные arguments не должны использовать один key.

Проверка: повторный retry `create_task_draft` не создает дубль.

Шаг 12. Выполняйте tools через очередь

Создайте `tool_execution_queue`.

Колонки:

id
run_id
candidate_id
tool_name
payload_json
idempotency_key
status
attempts
run_after
created_at
started_at
finished_at

Статусы:

`queued`;
`running`;
`completed`;
`failed`;
`retry_scheduled`;
`cancelled`;
`waiting_approval`;

Проверка: внешний API вызывается worker, а не напрямую из ответа модели.

Шаг 13. Сохраняйте результаты tools

Создайте `tool_result_log`.

Колонки:

id
run_id
execution_id
tool_name
status
result_json
result_summary
external_id
created_at

Результат должен быть нормализован:

{
  "ok": true,
  "resource_type": "task",
  "resource_id": "TASK-123",
  "summary": "Создан черновик задачи для менеджера"
}

Проверка: модель получает не сырой API response, а очищенный и безопасный результат.

Шаг 14. Настройте retries

Создайте `tool_retry_log`.

Колонки:

id
run_id
execution_id
tool_name
attempt
retry_reason
next_run_at
created_at

Retry разрешен для:

timeout;
rate limit;
transient API error;
network error;
temporary unavailable.

Retry запрещен для:

schema validation fail;
policy block;
access denied;
approval rejected;
insufficient funds;
invalid resource id;
dangerous action.

Проверка: policy block не повторяется автоматически.

Шаг 15. Добавьте approval для опасных действий

Создайте `approval_queue`.

Колонки:

id
run_id
candidate_id
tool_name
requested_action
risk_level
payload_summary
requested_by
approver
status
approved_at
rejected_reason

Через approval идут:

отправка email клиенту;
изменение CRM;
платеж;
возврат;
удаление данных;
публикация ссылки;
изменение прав;
экспорт PII;
массовое обновление;
внешний webhook с side effect.

Проверка: `send_email` создает approval и не попадает в `tool_execution_queue` до approve.

Шаг 16. Логируйте внешние API

Создайте `external_api_log`.

Колонки:

id
run_id
tool_name
provider
endpoint
method
request_hash
response_status
response_hash
latency_ms
created_at

Не пишите в обычные логи токены, raw PII и секреты. Храните hash и summary.

Проверка: по внешнему id можно связать tool execution и запрос к API.

Шаг 17. Обрабатывайте ошибки tools

Создайте `error_log`.

Колонки:

id
run_id
tool_name
component
error_code
error_message
retryable
attempt
created_at

Типовые ошибки:

invalid arguments;
policy denied;
approval rejected;
access denied;
API timeout;
rate limit;
duplicate idempotency key conflict;
resource not found;
provider error;
result schema invalid.

Проверка: пользователь получает понятное сообщение, а не "tool failed".

Шаг 18. Считайте latency и стоимость

Создайте `latency_log`.

Колонки:

id
run_id
component
operation
latency_ms
created_at

Создайте `cost_log`.

Колонки:

id
run_id
cost_type
provider
amount
currency
created_at

Считайте:

latency модели;
latency tool;
latency очереди;
стоимость model call;
стоимость внешнего API;
стоимость retries;
стоимость failed runs;
стоимость approval задержки.

Проверка: понятно, что дороже и медленнее: модель или tool.

Шаг 19. Верните результат tool обратно модели

После tool execution модель должна получить безопасный результат.

Правила:

вернуть только нужные поля;
убрать секреты;
маскировать PII;
добавить статус;
добавить external_id при необходимости;
добавить warning, если результат неполный;
не отдавать raw stack trace;
не отдавать внутренние tokens.

Пример:

{
  "tool": "create_task_draft",
  "status": "completed",
  "result": {
    "task_id": "TASK-123",
    "state": "draft",
    "url": "https://crm.example/tasks/TASK-123"
  }
}

Проверка: модель формирует ответ пользователю по безопасному tool result, а не по сырому API payload.

Шаг 20. Настройте audit log

Создайте `audit_log`.

Колонки:

id
run_id
user_id
event_type
tool_name
decision
summary
created_at

Фиксируйте:

tool предложен моделью;
schema validation passed или failed;
policy gate result;
approval request;
approval result;
tool queued;
tool executed;
tool failed;
retry scheduled;
result returned to model.

Проверка: по одному tool call можно восстановить весь путь от предложения модели до результата.

Шаг 21. Напишите системное правило для модели

Системное правило должно объяснять модели, что tools не являются прямыми действиями.

Шаблон:

Ты можешь предлагать tool calls только из списка доступных tools.
Ты не выполняешь действия сам.
Backend проверяет schema, права, policy и approval.
Если нужного tool нет, скажи, что действие недоступно.
Если данных недостаточно, запроси недостающие поля.
Для опасных действий всегда выставляй requires_approval=true.
Не пытайся обойти policy через другой tool.

Проверка: модель не выдумывает tools и не обещает, что действие уже выполнено, если оно только в approval.

Шаг 22. Сделайте tool prompt коротким

В описание tool включайте только то, что помогает выбрать tool.

Для каждого tool укажите:

когда использовать;
когда не использовать;
обязательные поля;
ограничения;
риск;
что вернется;
нужен ли approval.

Не кладите в tool description секреты, API paths, внутренние токены и длинные инструкции.

Проверка: model prompt содержит tool schema, но не раскрывает backend credentials.

Шаг 23. Добавьте тесты tool calling

Создайте `tool_eval_cases`.

Колонки:

id
case_name
input_json
expected_tool
expected_arguments_json
forbidden_tools_json
expected_policy_result
risk_level
is_active

Добавьте тесты:

обычный поиск в базе знаний;
создание черновика задачи;
нехватка обязательного поля;
попытка отправить email без approval;
prompt injection с просьбой удалить данные;
access denied;
invalid resource id;
retryable API error;
non-retryable policy block;
duplicate idempotency key.

Проверка: тест проверяет не только текст ответа, но и tool name, arguments и policy result.

Шаг 24. Запускайте tool eval runs

Создайте `tool_eval_runs`.

Колонки:

id
eval_case_id
agent_version
model_id
actual_tool
actual_arguments_json
policy_result
passed
failure_reason
created_at

Запускайте evals:

перед добавлением tool;
перед изменением schema;
перед заменой модели;
перед изменением prompt;
после инцидента;
по расписанию.

Проверка: если новая модель начала вызывать запрещенный tool, релиз блокируется.

Шаг 25. Проверьте end-to-end сценарий

Сценарий:

пользователь просит помочь с заявкой;
модель предлагает `search_knowledge_base`;
backend валидирует arguments;
policy gate разрешает read-only tool;
worker выполняет поиск;
результат возвращается модели;
модель предлагает `create_task_draft`;
backend проверяет schema и policy;
worker создает черновик;
модель предлагает `send_email`;
policy gate отправляет действие в approval;
письмо не отправляется до approve;
все события есть в `audit_log`.

Проверка: в production не произошло ни одного write-действия без backend approval.

Шаг 26. Минимальный результат для запуска

MVP tool calling готов, если выполнены условия:

есть `tool_registry`;
у каждого tool есть JSON Schema;
схемы версионируются;
есть `tool_policy`;
модель только предлагает tool call;
backend валидирует arguments;
backend проверяет policy gate;
write-действия требуют approval;
есть idempotency для write tools;
execution идет через очередь;
retries ограничены;
tool result нормализован;
все события есть в `audit_log`;
есть `tool_eval_cases`;
есть мониторинг latency, cost и errors.

Проверка результата: отключите tool в `tool_registry` и убедитесь, что модель не может выполнить его через старый prompt или повторный запрос.

Что нельзя автоматизировать в первой версии

В первой версии не автоматизируйте:

удаление данных;
платежи и возвраты;
изменение прав доступа;
отправку внешних сообщений без approval;
массовое обновление CRM;
публикацию ссылок;
экспорт PII;
создание новых tools моделью;
изменение tool schema моделью;
выполнение tool без backend validation;
retry policy block;
хранение API keys в prompt;
передачу raw API response модели;
работу без idempotency для write actions;
production-запуск без audit log.

Сначала подключите read-only и draft-only tools. Write-tools добавляйте только после evals, approval и мониторинга.

Частые вопросы

Tool calling и function calling - это одно и то же?

В практике почти да: модель возвращает имя функции или инструмента и JSON-аргументы. Важно не название, а архитектура: модель предлагает вызов, backend проверяет и только потом выполняет действие.

Можно ли доверять аргументам, которые вернула модель?

Нет. Аргументы всегда нужно валидировать через JSON Schema, проверять типы, лимиты, доступ к ресурсам, risk level и policy. Модель может ошибиться или попасть под prompt injection.

Почему tools нельзя выполнять прямо из ответа модели?

Потому что это обход безопасности. Между моделью и реальным API должен быть backend executor: schema validation, policy gate, idempotency, approval, retries, logs и audit trail.

Какие tools подключать первыми?

Начните с read-only: поиск по базе знаний, чтение статуса, получение карточки. Потом draft-only: создать черновик задачи или письма. Write-tools подключайте после approval и evals.

Что делать, если модель вызывает не тот tool?

Сохраните run в `tool_eval_cases`, уточните tool descriptions, schema и routing, проверьте model choice. Если ошибка dangerous, добавьте policy block и regression test.

Термины