Термин
Document parser
Компонент, который извлекает текст, таблицы, структуру и metadata из документа.
Document parser превращает PDF, DOCX, таблицу или изображение в структурированные данные. От качества parser зависит, сможет ли RAG и LLM правильно ответить по документу.