机器学习正则化ppt_[笔记]机器学习(Machine Learning) - 03.正则化(Regularization)

最新推荐文章于 2021-01-19 10:51:00 发布

weixin_39807352

最新推荐文章于 2021-01-19 10:51:00 发布

阅读量165

点赞数

文章标签：机器学习正则化ppt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39807352/article/details/111493460

版权

欠拟合(Underfitting)与过拟合(Overfitting) 上面两张图分别是回归问题和分类问题的欠拟合和过度拟合的例子。可以看到，如果使用直线(两组图的第一张)来拟合训，并不能很好地适应我们的训练集，这就叫欠拟合(Underfitting)，但是如果x的次数太高(两组图的第三张)，拟合虽然很好，但是预测能力反而变差了，这就是过拟合(Overfitting)。对于欠拟合，我们可以适当增加...

摘要由CSDN通过智能技术生成

欠拟合(Underfitting)与过拟合(Overfitting)

上面两张图分别是回归问题和分类问题的欠拟合和过度拟合的例子。可以看到，如果使用直线(两组图的第一张)来拟合训，并不能很好地适应我们的训练集，这就叫欠拟合(Underfitting)，但是如果x的次数太高(两组图的第三张)，拟合虽然很好，但是预测能力反而变差了，这就是过拟合(Overfitting)。

对于欠拟合，我们可以适当增加特征，比如加入x的多次方。通常这很少发生，发生的多的都是过拟合。那么如何处理过度拟合呢？

1. 丢弃一些不能帮助我们正确预测的特征。可以是手工选择保留哪些特征，或者使用一些模型选择的算法来帮忙(例如 PCA)。

2. 正则化。保留所有的特征，但是减少参数的大小(magnitude)。

加入正则化的代价函数

假设上面的线性回归过拟合例子使用使用的模型是：

我们可以看出这些高次项(3次方、4次方)导致了过拟合，高次项参数大了，从图像来看就是会变得非常曲折，高次项参数小了图像就会较为平整。所以这里我们要做的就是一定程度上减小高次项参数，削弱高次项的影响力。我们的做法是修改代价函数，给theta3、theta4一些惩罚，使得最终选出来的theta3、theta4比较小：

J(theta)=

通过

最低0.47元/天解锁文章

weixin_39807352

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习正则化ppt_[笔记]机器学习(Machine Learning) - 03.正则化(Regularization)

欠拟合(Underfitting)与过拟合(Overfitting) 上面两张图分别是回归问题和分类问题的欠拟合和过度拟合的例子。可以看到，如果使用直线(两组图的第一张)来拟合训，并不能很好地适应我们的训练集，这就叫欠拟合(Underfitting)，但是如果x的次数太高(两组图的第三张)，拟合虽然很好，但是预测能力反而变差了，这就是过拟合(Overfitting)。对于欠拟合，我们可以适当增加...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。