机器学习记录—模型评估方法
数据:m个样例的数据集 D={(X1,Y1),(X2,Y2),…(Xm, Ym)}
留出法
S为训练集,T为测试集,D=S∪T, S∩T=Ø
特点:测试集小时,评估结果的方差较大,训练集小时,评估结果的偏差较大,一般情况将2/3 ~ 4/5的样本用于训练,其余用于测试
(一般测试集至少包含30个样例)
交叉验证法
数据集D划分为k个大小相似的 互斥子集,D=D1∪D2∪D3…Dk Di∩Dj=Ø(i≠j),每次用k-1 个子集的并集作为训练集,剩余的子集作为测试集,最终返回的是这 k个测试结果
原创
2020-08-26 16:01:30 ·
158 阅读 ·
0 评论