对过拟合,欠拟合和正则化的理解

过拟合

定义:训练误差和测试误差之间的差距太大

原因:模型容量过大

后果:无法提取有效的结构信息,即解过多,无法选出一个泛化能力好的解

(这里就得解释一下模型容量和泛化能力的概念了,模型容量即拟合各种函数的能力,显然高次函数多项式的这种能力比低次的强,就说更高次的模型容量大。泛化能力即在未观测到的输入上表现的良好程度)


欠拟合

定义:模型不能在训练集上获得足够低的误差

原因:模型容量不足

后果:无法刻画真实函数的曲率


所以,过拟合和欠拟合的罪魁祸首就是模型容量,那如何改变模型容量呢?一般来说,有:

1.改变输入特征的个数(一个x的n次幂就是一个特征)

2.加入这些特征对应的参数


注意,当学习算法优化不完美时,学习算法的有效容量会小于模型族的表示容量

(表示容量:学习算法可以选取的函数族)


正则化

定义:以增大训练误差来减小测试误差的策略

正则化思路:1.向机器学习模型添加额外的约束,如增加参数的限制

                      2.向目标函数添加额外项

                      3.集成方法

常用的正则化策略:

1.参数范数惩罚

2.L^2参数正则化

3.L1参数正则化


显然,正则化可以用来解决过拟合问题







定义

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值