学习器在训练集上的误差被称为训练误差(training error)或经验误差(empirical error)。 在测试集上的误差被称为泛化误差。
如果对给定数据集进行划分以评估其泛化误差呢?一般有以下几个方法:
如何对学习器学到的模型的泛化能力进行评估呢?一般有以下几个指标:
一般来说,查准率和查全率是一对矛盾的变量。只有在简单的训练中,才可能将二者都变得很高。 可以通过保持 不变,来推出上诉关系。
一般学习器会为一个样本产生一个实值或概率预测,然后这个预测值与一个分类阈值(Threshold) 进行比较。若我们更重视查准率,分类阈值可以设高一点;如果我们更重视查全率,分类阈值可以设 低一点。