Термин
Baseline
Текущий базовый вариант системы, с которым сравнивают новые версии.
Baseline нужен, чтобы понять, помогло ли изменение: новая модель, prompt, RAG или fine-tuning сравниваются с текущим рабочим вариантом на одном eval dataset.