Термин

Document parser

Компонент, который извлекает текст, таблицы, структуру и metadata из документа.

Document parser превращает PDF, DOCX, таблицу или изображение в структурированные данные. От качества parser зависит, сможет ли RAG и LLM правильно ответить по документу.