吴恩达机器学习笔记（七）-正则化

最新推荐文章于 2023-04-23 20:32:13 发布

Messi-Q

最新推荐文章于 2023-04-23 20:32:13 发布

阅读量767

点赞数

分类专栏：机器学习机器学习与深度学习文章标签：机器学习正则化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34611579/article/details/80754169

版权

机器学习与深度学习同时被 2 个专栏收录

34 篇文章 43 订阅

订阅专栏

24 篇文章 24 订阅

订阅专栏

第八章正则化

过拟合问题

这一节中将讲述什么是过度拟合问题。

在数据拟合中，看一看下面的三种情况：

第一种称之为欠拟合，也叫高偏差；

第二种刚好拟合了数据；

第三种称之为过拟合，也叫高方差。在过拟合中，假设函数很好的匹配了训练集，但并不能很好的匹配测试集。

概括的说，过度拟合问题将会在变量过多的时候出现，它不能很好地泛化在新的样本中。上述的图片展示的是线性回归中的过度拟合现象，类似的同样可以应用到逻辑回归中，可以看一下下面的三种情况：

面对过拟合问题，我们有两种解决方式：

（1）尽量减少选取变量的数量，

方法：可以通过人工检查变量清单选择应该保留的变量；

可以使用模型算法自动的选择应该保留的变量。

（2）正则化，在保留所有特征量的情况下，但需要减少量级或减小θj。

当有很多特征时，其中每个变量都能对预测的y值产生一点影响。

代价函数

这一节中主要介绍正则化是怎样运行的。

在上一节中，可以看到通过二项式去拟合数据可以达到不错的效果，而用阶数过高的多项式去拟合数据会得到比较扭曲的线，虽然更好的拟合了数据，但出现了过拟合问题。

正则化的思想：如果参数值较小，参数值较小意味着会得到一个更简单的假设模型，这样也就更不让容易出现过拟合的问题。

利用正则化的思想下，我们应修改我们的代价函数如下：

修改代价函数中，这里的λ被称为正则化参数。这个正则化参数的作用就是控制两个不同目标的取舍，

第一个目标更好地去拟合训练集的目标，第二个目标是将参数控制得更小。λ的作用就是控制这两个目标之间的平衡关系。

如果λ 的取值过小，则抑制的效果越弱，而λ的取值过大，则会导致欠拟合现象。

线性回归的正则化

对于线性回归，推导了基于梯度下降和正规方程两种算法，这一节中主要介绍这两种算法推广到正则化的线性回归中去。

修改之后的梯度下降法：

修改之后的正规方程法：

增加的矩阵是个n+1维的方阵，对角线上除了第一个元素为0其他都为1。

逻辑回归的正则化

这一节中主要介绍这两种算法推广到正则化的逻辑回归中去。

修改后的逻辑回归中的代价函数：

修改之后的梯度下降法：

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。