机器学习Class 7：过拟合与正则化

最新推荐文章于 2024-07-25 16:05:31 发布

By4te

最新推荐文章于 2024-07-25 16:05:31 发布

阅读量77

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_49939117/article/details/119780155

版权

机器学习专栏收录该内容

36 篇文章 5 订阅

订阅专栏

目录

7-1 过拟合问题

7-2 代价函数

7-3 线性回归的正则化

1.梯度下降&正则化

2.正规方程&正则化

7-4 逻辑回归的正则化

7-1 过拟合问题

如图为房屋价格预测模型

对于该类问题，我们可以使用一次函数曲线拟合，但因实际上房价会随着面积增大而趋于稳定，因此一次函数不能很好的拟合数据集，称为欠拟合，即高偏差。

我们也可以使用四次函数曲线拟合，尽管曲线可能会包含所有数据点，但因四次曲线在图像上表现为一会凹一会凸不停波动的形式，因此不能很好的拟合，称为过拟合，即高方差。通常在变量过多时出现该情况。

解决方法：

1.减少特征数量

2.正则化（保留特征数量）

7-2 代价函数

若使用四次函数Θ0+Θ1*x+Θ2*x^2+Θ3*x^3+Θ4*x^4拟合数据，会产生过拟合问题。为了解决这一问题，我们在目标函数后加上惩罚项：a*Θ3^2+b*Θ4^2（a,b为较大的常数）。因为我们的目的是最小化目标函数J（Θ），因此为了达到这个目的，Θ3和Θ4要尽可能的小，即趋近于零。这即是正则化的思想。

正则化：较小的参数值，可以简化假设模型

实际上，在众多的特征量中无法预测哪个特征量关联度较低，因此需要使每个参数Θ都尽可能的小。代价函数如下：

λ为正则化参数，若λ过大，会导致所有θ都趋近于零，最后只剩θ0这一项，等同于用直线拟合数据，产生了欠拟合问题。

7-3 线性回归的正则化

1.梯度下降&正则化

无需对θ_0进行惩罚。

方法：

两式合一后可得下式：

为一个比1略小的数

2.正规方程&正则化

方法：

λ乘以（n+1）*(n+1)的矩阵，n为特征数量

3.不可逆

若样本数量m小于特征数量n则以下矩阵不可逆

但当λ>0时，正则化后的一定可逆

7-4 逻辑回归的正则化

逻辑回归也会产生过拟合问题，使用正则化后

高级优化算法：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习Class 7：过拟合与正则化

7-1 过拟合问题如图为房屋价格预测模型对于该类问题，我们可以使用一次函数曲线拟合，但因实际上房价会随着面积增大而趋于稳定，因此一次函数不能很好的拟合数据集，称为欠拟合。我们也可以使用四次函数曲线拟合，尽管曲线可能会包含所有数据点，但因四次曲线在图像上表现为一会凹一会凸不停波动的形式，因此不能很好的拟合，称为过拟合。解决方法：1.减少特征数量2.正则化（保留特征数量）7-2 代价函数若使用四次函数Θ0+Θ1*x+Θ2*x^2+Θ3*x^3+Θ4*x^4拟合数据，会产.
复制链接

扫一扫

专栏目录

By4te CSDN认证博客专家 CSDN认证企业博客

码龄4年

93: 原创

30万+: 周排名

151万+: 总排名

5万+: 访问

: 等级

974: 积分

368: 粉丝

27: 获赞

6: 评论

179: 收藏

私信

关注

热门文章

分类专栏

机器学习 36篇
C++ 30篇
Linux 5篇
数据结构 8篇
计算机网络 6篇
操作系统 5篇
元分析 1篇
Sleep stage 1篇
深度学习 10篇
Python 42篇

最新评论

脑电分析工具MNE教程
宸静: 使用scikit-learn进行多分类时，这里报错，TypeError: psd_welch() got an unexpected keyword argument 'picks' 这个怎么解决呢
人工智能实践：Tensorflow笔记 Class 5：卷积神经网络
青青子佩983: 明白了，谢谢
人工智能实践：Tensorflow笔记 Class 5：卷积神经网络
By4te: 卷积核的个数，决定了当前层输出特征图的深度
人工智能实践：Tensorflow笔记 Class 5：卷积神经网络
青青子佩983: 问一下卷积操作的时候为什么是6个5*5的卷积核
C++学习笔记（Ⅳ）：职工管理系统
By4te: 理解： 3节：创建WorkManager（职工管理函数），在头文件中声明，源文件中实现（包含构造和析构函数）。此函数中包含各类功能函数。 4节：菜单展示函数 5节：创建管理函数下的实例，提供菜单选择功能；实现菜单退出功能 6节：创建Worker抽象类（父类），提供父类行为纯虚函数及属性；创建employee、manager、boss子类，并进行属性初始化，提供父类纯虚函数的实现； 7节：头文件声明，源文件实现添加职工函数 8节：析构函数释放堆区内容；添加文件保存函数 9节：以不同方式读取文件 10节：显示职工信息 11节：删除职工 12节：修改职工信息 13节：查找职工 14节：排序 15节：清空文件

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。