Таблица 1.4. Популярные метрики для автономной оценки качества моделей
Задача
Автономные метрики
Классификация
Точность (precision), полнота (recall), F₁-мера, доля верных результатов (accuracy), ROC-AUC, PR-AUC, матрица ошибок
Регрессия
MSE, MAE, RMSE
Ранжирование
Точность на k элементах (precision@k), полнота на k элементах (recall@k), среднеобратный ранг (MRR), mAP, nDCG
Генерирование изображений
Расстояние Фреше (FID) [32], «мера внедрения» (Inception Score) [33]
Обработка естественного языка
BLEU [34], METEOR [35], ROUGE [36], CIDEr [37], SPICE [38]