Обычная LLM отвечает на основе своего обученного знания и текущего промпта. RAG добавляет перед ответом еще один шаг: найти релевантный контекст. Пользователь задает вопрос, система ищет подходящие документы, выбирает важные фрагменты, кладет их в контекст модели, а модель формирует ответ уже с учетом найденных источников.
Главная польза RAG — ответы можно привязать к актуальным данным компании. Например, агент поддержки отвечает по свежему регламенту возвратов, внутренний помощник ищет инструкции в базе знаний, юридический агент сверяется с шаблонами договоров, а аналитический агент объясняет метрики по документации. Для таких задач не нужно каждый раз дообучать модель: достаточно правильно подготовить источники и поиск.
Но RAG не делает систему автоматически точной. Если документы устарели, плохо нарезаны на фрагменты, нет фильтров по правам доступа или поиск находит нерелевантный контекст, модель все равно может ошибаться. Поэтому хороший RAG состоит не только из векторной базы, но и из индексации документов, chunking, retriever, metadata filters, citations, evals, diagnostics и guardrails.
Примеры
- Пользователь спрашивает про возврат товара, а агент сначала находит актуальный регламент возвратов и отвечает по нему.
- Сотрудник задает вопрос по внутренней базе знаний, и RAG-система достает нужную инструкцию из корпоративных документов.
- Юридический агент анализирует договор, сверяясь с шаблонами и политиками компании.
- AI-помощник для продаж готовит ответ клиенту, используя карточку продукта, FAQ и историю сделки в CRM.
- BI-агент объясняет показатель в отчете, опираясь на metric catalog и описание источников данных.
Где используется
- Подключить ИИ-агента к базе знаний без дообучения модели.
- Сделать внутренний поиск по документам, регламентам и инструкциям.
- Уменьшить галлюцинации за счет ответов с опорой на источники.
- Показывать цитаты и ссылки на документы, из которых взят ответ.
- Обновлять знания агента через документы, а не через переобучение модели.
- Ограничивать ответы по правам доступа, отделам, клиентам или типам документов.
- Строить помощников для поддержки, HR, юристов, продаж, аналитики и обучения.
- Сравнивать качество разных настроек поиска через RAG Evals.
- Диагностировать ошибки ответов через trace, найденные фрагменты и источники.
Связанные термины
Частые вопросы
Что такое RAG простыми словами?
RAG — это когда нейросеть перед ответом получает найденные документы или данные и отвечает с опорой на них. Это помогает использовать актуальные знания компании, а не только общие знания модели.
Чем RAG отличается от дообучения модели?
Дообучение меняет саму модель, а RAG подставляет нужный контекст перед ответом. Для корпоративных знаний RAG обычно быстрее, дешевле и удобнее обновлять.
Нужна ли для RAG векторная база?
Часто да, если нужен смысловой поиск по текстам. Но RAG может использовать и полнотекстовый поиск, SQL, фильтры по метаданным, гибридный поиск или несколько источников одновременно.
Почему RAG иногда ошибается?
Ошибки появляются, если система нашла не тот документ, источник устарел, фрагменты плохо нарезаны, в контексте много шума или модель сделала вывод, который не подтверждается найденными данными.
Как понять, что RAG работает хорошо?
Нужно проверять качество поиска, точность ответа, цитаты, полноту, соблюдение прав доступа и стабильность на реальных вопросах. Для этого используют RAG Evals и RAG Diagnostics.