Термин
Training dataset
Набор примеров, на которых модель обучается или дообучается.
Training dataset для fine-tuning должен содержать качественные input/output примеры, единый стиль, правильные ответы, очищенные данные и разделение на train, validation и test. Плохой dataset учит модель плохому поведению.