一.模型偏差
1.即无法找到损失低的函数(水盆捞针,针不在盆)
2.解决方案:①增加输入的特征②利用深度学习,提升网络灵活性
二.优化问题
1.梯度下降存在问题如:可能卡在局部最小值,无法找到真正让损失低的函数
2.如何判断找不到损失低的函数是模型偏差还是优化的问题
①通过比较不同的模型来判断模型是否够大
ps:可采用线性模型或支持向量机(SVM)即由浅入深
②深浅对比
三.过拟合
解决过拟合:
①增大训练集(最有效)
②给模型一些限制(降低灵活性)
1)给模型比较少的参数
2)提供比较少的特征
3)其他:早停,正则化,丢弃法
ps:限制不宜过多,否则会导致模型偏差
四.交叉验证
将训练数据分为两部分:训练集和验证集(在训练集上训练出来的模型会使用验证集来评估效果)
问题:随机分配导致结果不好
解决办法:k折交叉验证
五.不匹配
1.即数据反常(训练集和测试集分类不同)
2.不匹配≠过拟合