谷歌机器学习课程笔记(6)——训练集和测试集

测试集是用于评估根据训练集开发的模型的数据集。

 

拆分数据

 

数据集可拆分为两个子集:

  • 训练集 - 用于训练模型的子集。
  • 测试集 - 用于测试训练后模型的子集。

测试集需要确保满足以下两个条件:

  • 规模足够大,可产生具有统计意义的结果。
  • 能代表整个数据集。换言之,挑选的测试集的特征应该与训练集的特征相同。

请勿对测试数据进行训练。 如果评估指标取得了意外的好结果,则可能表明不小心对测试集进行了训练。

Pingbacks已关闭。

Trackbacks

评论已关闭