Stanford机器学习---第五讲. 过拟合问题的解决 Regularization

最新推荐文章于 2024-04-26 00:15:00 发布

linuxcumt

最新推荐文章于 2024-04-26 00:15:00 发布

阅读量598

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linuxcumt/article/details/8575096

版权

机器学习专栏收录该内容

12 篇文章 1 订阅

订阅专栏

=============The Problem of Overfitting===============

1.bias大，underfittign

variance大，overfitting

2.logistic回归中的过拟合，注意其函数是logistic，而参数是非线性。因为本身图是线性不可分（除最左）

3.overfitting是由于特征选取太多。或者删掉部分特征（自动算法）；或者regularization

=============Regularization Cost Function============

1.因为θ3，θ4的引入会造成过拟合，所以，在Cost Function里面，增加两项。

这样为使得Cost Function极小，则θ3，θ4越小越好。这样既考虑了特征x3,x4，又解决了

过拟合问题。

2.对于现实总上百个特征，我们也不知道该“收缩”哪个特征，干脆在花费函数里

都“收缩”。

3.下图是加上“收缩”项的结果，粉色图。注意"人"起调节粉红线的作用。

4."人"太大，则θ会很小，于是只剩常数项，underfitting

============Regularized Linear Regression============

1.在加入了regulariztion的cost funciton中，新的梯度下降如下：

实际左右---每次用更小的θ（0.99*θ）去减

2.对于Nomal Equations方法来说，此时求cost funciton中的θ，

则用下述公式：

==========Regularized Logistic Regression================

1.对于Logistic Regression，加入regulariztion后，粉色线才更合理

2.在加入了regulariztion的cost funciton中，新的梯度下降如下：

3.在加入了regulariztion的cost funciton中，新的梯度下降求

θ，使得J(θ)最小的伪码实现。注意：costFunction定义好后要作为fminus的参数

图中，jval表示cost function 表达式，其中最后一项是参数θ的惩罚项；下面是对

各θj求导的梯度，其中θ0没有在惩罚项中，因此gradient不变，θ1~θn分别多了

一项(λ/m)*θj；至此，regularization可以解决linear和logistic的overfitting regression

问题了~

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。