直接将数据集分为两个互斥的集合,其中一个集合用作训练模型,另一个作为测试集。 训练集和测试集的划分要尽可能的保持数据分布的一致性,即划分之后的集合中各个分类的分布 与划分之前相同。
使用留出法时,一般要采用若干次随机划分、重复进行实验评估后取平均值作为最终的结果。
常见做法是将 2/3 或 4/5 的数据作为训练集。
直接将数据集分为两个互斥的集合,其中一个集合用作训练模型,另一个作为测试集。 训练集和测试集的划分要尽可能的保持数据分布的一致性,即划分之后的集合中各个分类的分布 与划分之前相同。
使用留出法时,一般要采用若干次随机划分、重复进行实验评估后取平均值作为最终的结果。
常见做法是将 2/3 或 4/5 的数据作为训练集。