Термин RAG и базы знаний Начальный

Hybrid search

Hybrid search — поиск, который объединяет keyword search и semantic search, чтобы находить документы и по точным словам, и по смыслу.

гибридный поиск hybrid retrieval keyword + vector search BM25 + vector search semantic + keyword search комбинированный поиск
Hybrid search — это гибридный поиск: комбинация классического поиска по словам и семантического поиска по смыслу. Обычно он совмещает keyword-поиск вроде BM25 и vector search на embeddings.

Проще говоря, hybrid search помогает найти документы даже тогда, когда пользователь формулирует вопрос не теми словами, которые есть в базе, но при этом не теряет точные совпадения: артикулы, номера договоров, имена клиентов, коды ошибок, названия функций и юридические формулировки.

Для RAG это особенно важно. Чистый векторный поиск хорошо ловит смысл, но может пропустить точное значение вроде “SLA-24”, “ИНН”, “ошибка 403” или “пункт 5.2”. Чистый keyword search хорошо ищет точные слова, но хуже понимает перефразированные вопросы. Hybrid search объединяет оба сигнала и часто дает более стабильный retrieval.

На практике гибридный поиск часто дополняют reranking. Сначала система собирает кандидатов из keyword и vector search, затем reranker пересортировывает их по релевантности. Так AI-агент получает меньше случайных чанков и больше полезного контекста для ответа.

Примеры

  • Пользователь спрашивает “как вернуть товар”, а hybrid search находит раздел “оформление возврата” даже без точного совпадения слов.
  • Запрос “ошибка 403 в API” должен найти точный код ошибки, поэтому одного semantic search может быть мало.
  • В базе договоров hybrid search ищет и по смыслу условия, и по точному номеру пункта.
  • AI-агент поддержки использует hybrid search, чтобы найти статью с названием функции и похожим описанием проблемы.
  • После добавления reranking ответы RAG-системы стали точнее, потому что в контекст попадают более релевантные чанки.

Где используется

  • RAG-поиск по базе знаний компании
  • Корпоративный поиск по документам, регламентам и wiki
  • Поиск по договорам, тендерам и юридическим документам
  • Поддержка пользователей по ошибкам, артикулам и названиям функций
  • Поиск по каталогам товаров, SKU и описаниям
  • Улучшение retrieval перед ответом AI-агента
  • Снижение галлюцинаций за счет более точного контекста

Связанные термины

Частые вопросы

Чем hybrid search отличается от semantic search?

Semantic search ищет по смыслу через embeddings. Hybrid search добавляет к нему keyword-поиск, поэтому лучше работает с точными словами, номерами, кодами, именами, артикулами и формальными терминами.

Когда нужен hybrid search?

Когда в запросах есть и смысловые формулировки, и точные значения: номера документов, SKU, ошибки, названия функций, имена клиентов, юридические пункты или технические термины.

Нужен ли reranker вместе с hybrid search?

Не всегда, но часто помогает. Hybrid search собирает кандидатов из разных типов поиска, а reranker может точнее выбрать, какие фрагменты действительно полезны для ответа.

Почему hybrid search важен для AI-агента?

AI-агент зависит от качества найденного контекста. Если retrieval приносит неправильные чанки, даже сильная модель отвечает хуже. Hybrid search повышает шанс найти и смысл, и точные совпадения.

Где читать дальше

Статьи по теме

Инструменты

Связанные инструменты