分类任务中常用的评估方法 Average Precision (AP) and Mean Average Precision (MAP)
通常分类问题中,物体的类型依赖于分类器的阈值,阈值决定了它是鸟还是飞机。
在介绍AP和MAP指标之前,我们先了解一些知识。
评价一个检索系统(例如搜索引擎)的优劣一般会关注两件事情:
- 检索出来的结果和想要搜索的内容有多么的相关(相关性),一般称为precision 查准率。
- 检索出来的正确的结果占总共的相关内容的比例(总相关内容包含:已检索出的相关内容和未检索出的相关内容),一般称为recall 查全率。
本文将介绍什么是precision和recall,同时也会解释一些文献中对P-R曲线进行比较时存在的疑惑。
鸟与飞机
待续