Термин Качество и безопасность AI Начальный

Галлюцинация ИИ

Галлюцинация ИИ - это правдоподобный, но неверный или неподтвержденный ответ модели: выдуманный факт, ссылка, число, цитата, метод API или вывод без опоры на источник.

AI hallucination LLM hallucination галлюцинации ИИ галлюцинация модели выдуманный ответ неподтвержденный ответ fabrication конфабуляция модели

Галлюцинация ИИ - это ситуация, когда модель отвечает уверенно и связно, но внутри ответа есть ошибка: выдуманный факт, несуществующая ссылка, неправильное число, неверная цитата, несуществующая функция в коде или вывод, которого нет в документах. Опасность в том, что такой ответ часто выглядит убедительно.

Проще говоря, модель не хранит “истину” как базу данных. Она генерирует наиболее вероятное продолжение текста с учетом промпта и контекста. Если ей не хватает фактов, источник устарел, вопрос сформулирован слишком жестко или промпт требует отвечать любой ценой, модель может заполнить пробел красивой догадкой.

Не каждая ошибка модели - галлюцинация. Если модель плохо классифицировала письмо, перепутала формат JSON или нарушила инструкцию, это может быть ошибка выполнения. Галлюцинацией обычно называют именно выдумку или неподтвержденное утверждение, которое подается как факт.

В творческих задачах галлюцинация иногда не критична: идеи заголовков, варианты структуры, черновик рекламного текста или образ для иллюстрации могут быть свободными. Но в поддержке клиентов, медицине, юриспруденции, финансах, аналитике, коде, документах и AI-агентах галлюцинации опасны. Агент может не только написать неверный ответ, но и вызвать инструмент, изменить данные или отправить клиенту неправильное обещание.

RAG снижает риск галлюцинаций, потому что модель получает релевантные фрагменты из базы знаний. Но RAG не решает проблему полностью: поиск может вернуть не тот документ, контекст может быть неполным, а модель может неправильно связать источники. Поэтому нужны citations, проверка источников, groundedness/faithfulness-метрики, evals и human review для критичных сценариев.

Практически риск снижают так: явно разрешают модели говорить “не знаю”, требуют ссылаться на источник, отделяют факты от предположений, запрещают выдумывать ссылки и числа, проверяют ответы на тестовых кейсах, логируют сомнительные ответы, ограничивают опасные действия и отправляют спорные случаи человеку на approval.

Примеры

Модель уверенно ссылается на закон, которого нет, или придумывает номер статьи.
AI-ассистент пишет клиенту, что возврат денег уже одобрен, хотя в CRM такого статуса нет.
Кодовый помощник предлагает метод API, который логично называется, но отсутствует в реальной версии библиотеки.
RAG-бот отвечает по базе знаний, но добавляет условие доставки, которого не было в найденных документах.
Модель придумывает ссылку на источник или цитату, потому что в промпте попросили обязательно дать подтверждение.

Где используется

проверка качества LLM-ответов
RAG по базе знаний
поддержка клиентов
юридические и финансовые документы
AI-агенты с доступом к инструментам
кодогенерация и code review
аналитические отчеты
проверка источников и citations
evals перед запуском
guardrails и human review

Связанные термины

Agent trace Approval workflow ChatGPT Citation в ответе AI Citations Confidence score Confidence в ресерче Context engineering

Частые вопросы

Что такое галлюцинация ИИ простыми словами?

Это правдоподобный, но неверный ответ модели. Например, она может придумать факт, ссылку, цитату, число, пункт договора или функцию в коде и подать это как уверенную правду.

Почему ИИ галлюцинирует?

Модель генерирует вероятный ответ, а не проверяет факты сама по себе. Если в контексте нет нужной информации, источник устарел или промпт просит отвечать любой ценой, модель может заполнить пробел догадкой.

RAG полностью убирает галлюцинации?

Нет. RAG снижает риск, потому что добавляет документы в контекст, но поиск может вернуть не те фрагменты, документы могут противоречить друг другу, а модель может неверно интерпретировать источник.

Как понять, что ответ модели - галлюцинация?

Проверьте, есть ли утверждение в источнике, совпадают ли числа и даты, существует ли ссылка, поддерживается ли вывод найденным контекстом. Для RAG полезны citations, source verification, groundedness и faithfulness-проверки.

Как снизить риск галлюцинаций в AI-агенте?

Разрешите агенту отвечать “не знаю”, подключите RAG к проверенным источникам, запретите выдумывать факты, логируйте ответы, запускайте evals, ограничьте опасные tools и отправляйте спорные действия на human review.

Где читать дальше

Статьи по теме

Пошаговые инструкции 10 мин

Как использовать Perplexity Sonar для ресерча рынка и сбора источников

Пошаговая инструкция: как через Perplexity Sonar сформулировать research question, собрать источники, сделать таблицу фактов, сравнить игроков и подготовить brief.

пошаговая инструкция Perplexity Sonar ресерч рынка

AI-агенты 13 мин

Что такое LLMOps и как управлять ИИ-системой в продакшене

Простое объяснение LLMOps: как управлять промптами, моделями, RAG, tools, evals, observability, стоимостью, релизами и откатами в AI-продукте.

AI-агенты evals observability

Основы AI 7 мин

Что такое evals в ИИ и как проверять качество ответов модели

Простыми словами: что такое evals, зачем проверять ИИ на контрольных примерах, как сравнивать версии модели, промпта, RAG и AI-агента.

RAG AI-агенты tool calling

AI-агенты 13 мин

Что такое guardrails в ИИ и зачем они нужны агентам

Простое объяснение guardrails: какие проверки нужны вокруг ИИ, чем они отличаются от системного промпта, как защищают RAG, tools, память и ответы агента.

AI-агенты Guardrails Prompt injection

Основы AI 7 мин

Что такое галлюцинации ИИ и почему нейросети ошибаются

Простыми словами: что такое галлюцинации ИИ, почему модель уверенно выдумывает факты, ссылки и числа, где это опасно и как снижать риск.

RAG Guardrails основы AI

GPT и LLM 13 мин

Что такое токены и контекстное окно в ИИ

Простое объяснение токенов и контекстного окна: как ИИ считает текст, почему длинные запросы стоят дороже, что попадает в контекст и как не перегружать модель.

LLM GPT основы AI

Инструменты