立即学习:https://edu.csdn.net/course/play/26109/323208?utm_source=blogtoedu
好的模型:泛化能力强
训练集+测试集上表现好
2min
过拟合:模型过于复杂,训练数据不多/不够,不需要学习的噪声进去
测试集不好,训练集好
2:54min 好的规律,大的线
欠拟合:模型学得不够:提升模型复杂度,1:线性->非线性 ,2:提升训练轮次,更多迭代
4:30min
数据划分
5min: 实际:验证/测试集分开
尽可能泛化能力好,在各个数据集上表现好->数据多
数据少?
6:10min 业界成熟做法:
1)简单划分
/2)K折验证:3个分区,按照顺序来
每次换 验证集
K=10 也可 /随机化,shuffle 也可提升模型泛化能力
9:30min
3)图像数据:数据增强 :
旋转,变化等 人为 增强数据场景
数据量的增加
model.fit:训练集,验证集 同时输入
model.evaluate:测试集输入,评估