python机器学习---模型选择3【欠拟合(高偏差)、过拟合(高方差)以及相关模型改善方法和建议】

本文探讨了在机器学习中遇到模型预测误差大时的解决策略,主要围绕高偏差(欠拟合)和高方差(过拟合)问题展开。介绍了偏差-方差窘境,通过增加训练样本、减少特征或正则化等方法调整模型。同时,阐述了正则化的作用,如L2正则化防止过拟合,并提供了选择合适正则化参数λ的步骤。最后,学习曲线作为评估模型的重要工具,能帮助判断模型是受偏差还是方差影响。
摘要由CSDN通过智能技术生成

一、当模型预测未知数据效果误差巨大时,解决方法?

当我们用已经训练好的模型来预测未知数据发现巨大误差时,下一步要做的改进模型的方法通常有六种:

1.获得更多的训练样本----解决高方差

2.尝试减少特征的数量----解决高方差

3.尝试获得更多的特征----解决高偏差

4.尝试增加多项式特征----解决高偏差

5.尝试减少归一化程度λ----解决高偏差

6.尝试增加归一化程度λ----解决高方差

因此,当模型预测发现巨大误差,我们首先要判断误差原因是高偏差还是高方差即模型欠拟合还是过拟合,下面是涉及到的相关知识的学习记录。

二、高偏差和高方差(欠拟合和过拟合)问题

1、偏差-方差窘境

对算法的泛化误差进行拆解:

学习算法的泛化误差为:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值