Термин

Парсинг документов

Преобразование PDF, DOCX, HTML или других файлов в текст, блоки, таблицы и metadata.

Парсинг документов нужен до LLM: система извлекает страницы, заголовки, абзацы, таблицы, изображения и metadata. Без парсинга агент не сможет надежно ссылаться на страницы и проверять качество ответа.