机器学习系统设计和诊断方法学习总结

最新推荐文章于 2023-05-18 09:30:37 发布

戏台无戏子&youngthful

最新推荐文章于 2023-05-18 09:30:37 发布

阅读量306

点赞数

分类专栏：学习积累深度学习文章标签：机器学习误差诊断系统设计

本文链接：https://blog.csdn.net/u011376563/article/details/83021441

版权

积累同时被 3 个专栏收录

23 篇文章 1 订阅

订阅专栏

学习

20 篇文章 0 订阅

订阅专栏

深度学习

4 篇文章 0 订阅

订阅专栏

过拟合：对训练数据拟合精准，但是对未知的数据预测能力差
如何应对？
2、丢弃一些不能帮助正确预测的特征。
2.1、手工选择丢弃特征
2.2、使用模型选择方法（如PCA）
3、正则化。保留所有的特征，减少参数的大小

预防过拟合的方法步骤：
1、打乱数据集；2、划分数据：70%训练集 + 30%测试集

帮助模型选择的方法：
交叉验证：1、打乱数据集；2、划分数据：60%训练集 + 20%交叉验证集 + 20%测试集

如何选择模型？
1、预先训练10个模型
2、计算10个模型的交叉训练集的预测误差
3、选取代价函数最小的模型
4、用步骤3选出的模型对测试集计算得出推广误差

诊断偏差和方差
高偏差和高方差的问题基本上是欠拟合和过拟合的问题
1、Jtraing（训练集误差）和Jcv（交叉验证集误差）都很大：偏差/欠拟合
2、Jtraing小，Jcv远远大于Jtraing：方差/过拟合

正则化和偏差方差
正则化因子lambda的选择方法：
1、使用训练集训练12个不同程度正则化的模型
2、计算12个模型的交叉训练集的预测误差
3、选取代价函数最小的模型
4、用步骤3选出的模型对测试集计算得出推广误差

lambda较小时：
Jtraing很小，而Jcv较大：方差/过拟合
随着lambda的增大：
Jtraing不断增大（欠拟合），Jcv先减小后增大
因此，应该选择适中的lambda，不能过大或过小

学习曲线：即训练样本数目m和Jtraing、Jcv的关系图
在高偏差/欠拟合的情况下，增加训练集样本数不一定能够提升模型能力，应该考虑切换模型
在高方差/过拟合的情况下，增加训练集样本数可以一定程度的提升模型能力

总结一下：

欠拟合/偏差大：
现象：Jtrain较大，同时Jcv/Jtest较大
原因：模型复杂度不够，对训练数据集拟合程度较低；特征数量n相比训练样本数量m较少；正则化因子lambda较大
解决办法：
1、使用数次较高的多项式特征，增加模型复杂度
2、增加特征数量n
3、减小正则化因子lambda的值

过拟合/方差大：
现象：Jtrain较小，同时Jcv/Jtest较大
原因：模型复杂度过高，对训练数据集拟合非常好，但是对测试数据集效果差；样本数量m相比特征数量n较少；正则化因子lambda较小
解决办法：
1、降低模型模型复杂度，降低多项式特征次数
2、减少影响较小的特征数量/增加样本数量
3、增大正则化因子lambda

针对神经网络：
模型效果：大神经网络+正则化 > 小神经网络
选择隐藏层数目时，从1层开始逐层增加，选择交叉验证集代价函数最小的网络。

戏台无戏子&youngthful

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习系统设计和诊断方法学习总结

过拟合：对训练数据拟合精准，但是对未知的数据预测能力差如何应对？2、丢弃一些不能帮助正确预测的特征。2.1、手工选择丢弃特征2.2、使用模型选择方法（如PCA）3、正则化。保留所有的特征，减少参数的大小预防过拟合的方法步骤：1、打乱数据集；2、划分数据：70%训练集 + 30%测试集帮助模型选择的方法：交叉验证：1、打乱数据集；2、划分数据：60%训练集 + 20%交叉验证集...
复制链接

扫一扫

专栏目录