划分数据集方法
目前我常用的划分数据集方法分为两种:
- 按照比例划分
- 交叉验证
其中,交叉验证方法中最为熟知的可能是K折交叉验证,常用的有3、5、10折。
LeaveOneOut也属于交叉验证。
基本原理
将数据集划分N份,其中n-1份用于train,剩下的1份用于val。将这一过程重复n次,所有的数据都能被用作val,最终得到的模型的性能指标的平均值就是模型的性能。
参考
https://blog.51cto.com/u_16213304/7351948
感谢大佬的分享,本篇文章仅作为学习笔记,侵删!