正则化（Regularization）

最新推荐文章于 2021-05-23 07:13:58 发布

TQ2

最新推荐文章于 2021-05-23 07:13:58 发布

阅读量1.8k

点赞数 2

分类专栏：吴恩达机器学习总结

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45735242/article/details/106741885

版权

吴恩达机器学习总结专栏收录该内容

17 篇文章 2 订阅

订阅专栏

目录

过拟合的问题
代价函数
线性回归的正则化
Logistic.回归的正则化

过拟合的问题

正则化通过加大对参数Θ的惩罚力度可以减轻过拟合问题。

下图左1：欠拟合（underfitting）具有高偏差（high bias）。

下图中1：合适。

下图右1：过拟合（overfitting）具有高方差（high variance）。

泛化（generalize）：指假设模型能应用到新样本的能力。

在线性回归中：
在这里插入图片描述
在逻辑回归中：

特征维度太多，样本数据太少，过度拟合就会发生：

解决过度拟合方法：

1.减少特征数量（缺点：舍弃了一部分信息）：
手动选择；
使用模型选择算法。

2.正则化（regularization）：
保留所有的特征，但是减少参数θj的大小（magnitude/values），当我们有很多特征的时候依然工作很好，并且每个特征都对预测y有一定的贡献。
**加粗样式**

代价函数

在这里插入图片描述

正则化的思想：

减小高次项的θ值，使得曲线平滑（即加入惩罚项）。
加入正则项（不将 θ0 加入惩罚项，实际上加不加入影响不大）。
λ是正则化参数，保持我们能很好的拟合数据，保持参数较小从而避免过拟合。
λ不能太大（惩罚力度大），否则就是一条直线，（underfitting/too high bias），肯定也不能太小（惩罚力度小），否则就没效果了。
在这里插入图片描述

线性回归的正则化

基于梯度下降（gradient decent）算法下的正则化线性回归计算：

通常不将 θ0 加入惩罚项，所以排除在外。
其他相当于把 θj 减小。
在这里插入图片描述
基于正规方程（normal equation）中的正则化线性回归计算：

X：每一行代表一个单独的训练样本。
加粗样式
如果样本数量（m）小于特征数量（n）那么矩阵不逆；虽然在Octave中运用pinv函数能得到伪逆矩阵，但是不能得到较好的假设模型。

在正则化中已经考虑到这个问题，所以加入正则化项后，只要 λ>0 那么该矩阵可逆。

正则化还可以解决一些 (X^TX)^-1 出现不可逆的问题。
在这里插入图片描述

Logistic.回归的正则化

改进在线性回归中的两种算法，使其能够应用到正则化逻辑回归中：

在这里插入图片描述
在Octave中：

使用高级优化算法需要我们自己定义一个 costFunction 函数（在Octave中下标从1开始）。
然后将定义的函数赋给 fminunc(@costFunction,…) 函数。

在这里插入图片描述

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
正则化（Regularization）

目录过拟合的问题代价函数线性回归的正则化Logistic.回归的正则化过拟合的问题正则化通过加大对参数Θ的惩罚力度可以减轻过拟合问题。下图左1：欠拟合（underfitting）具有高偏差（high bias）。下图中1：合适。下图右1：过拟合（overfitting）具有高方差（high variance）。泛化（generalize）：指假设模型能应用到新样本的能力。在线性回归中：在逻辑回归中：特征维度太多，样本数据太少，过度拟合就会发生：解决过度拟合方法：1.减少特征数量（
复制链接

扫一扫

专栏目录

TQ2 CSDN认证博客专家 CSDN认证企业博客

码龄5年

76: 原创

24万+: 周排名

202万+: 总排名

21万+: 访问

: 等级

2233: 积分

84: 粉丝

261: 获赞

32: 评论

499: 收藏

私信

关注

热门文章

分类专栏

最新评论

基于PaddleX实现电梯电瓶车检测
梁思聪: 求问博主，加载模型的时候那个best_model不存在是为什么呢？把你的全部代码都跑过了，但我的outputs/yolo的那个文件夹下面没有这个文件
Paddle2.0实现PSPNet进行人体解析（图像分割）
Qualony: 大佬这个有没有开源项目啊，可以配置了在本地运行的
PTA练习题：表达式求值_1
lintingjiayou: num *= 10; num += (e[i+1] - '0'); 请问这两步有什么作用
使用 Numpy 实现 K-Means 聚类算法
HGGshiwo: 博主的算法很强，但是这个变量命名看的我眼都花了
Paddle2.0实现PSPNet进行人体解析（图像分割）
qq_46161395: 你好，请问resnet模型里面第三和第四层的stride参数是不是应该设置为2？设置为1的话第三第四层输出的特征层的形状没有发生改变，还是故意设计成这样的？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。