首先根据学习器的预测结果对样例进行排序,排在前面的是学习器认为最可能是正例的样本。 按此顺序逐个把样本作为正例进行预测,可以计算出当前的查全率和查准率。 以查准率为纵轴,查全率为横轴,绘制的曲线称为 P-R 曲线。 我们可以通过比较不同学习器下 P-R 曲线与坐标轴围成的面积大小,来评估不同学习器的好坏。 但这个值不容易估算,因此又提出平衡点(Break-Even Point)——查全率和查准率相等时的取值, 来简单表征学习器的好坏。 除开平衡点之外,还有 F1 度量(加权调和平均)等。