COURSERA机器学习笔记——归一化(二)

最新推荐文章于 2022-10-30 23:47:41 发布

积微成著

最新推荐文章于 2022-10-30 23:47:41 发布

阅读量1.1k

点赞数

分类专栏： Machine Learning 文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/duxu24/article/details/52663366

版权

Machine Learning 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

过拟合问题(THE PROBLEM OF OVERFITTING)

通过学习得到的假设,可能能够非常好地适应训练集(代价函数可能几乎为 0),但是可能会不能推广到新的数据。
下图是一个回归问题的例子:

这里写图片描述

第一个模型是一个线性模型,低度拟合,不能很好地适应我们的训练集。这个问题的另一个术语叫做高偏差(high bias);
第三个模型是一个四次方的模型,过度拟合,虽然能非常好地适应我们的训练集但在新输入变量进行预测时可能会效果不好。这个问题的另一个术语叫做高方差(high variance),将会在变量多的时候发生;
中间的模型似乎最合适。

分类问题中也存在这样的问题:

这里写图片描述

问题是,如果我们发现了过拟合问题,应该如何处理?

这里写图片描述

归一化代价函数(REGULARIZATION COST FUNCTION)

假如我们有非常多的特征,我们并不知道其中哪些特征我们要惩罚,我们将对所有的特征进行惩罚,并且让代价函数最优化的软件来选择这些惩罚的程度。这样的结果是得到了一个较为简单的能防止过拟合问题的假设:

这里写图片描述

其中λ又称为归一化参数(Regularization Parameter)。
注:根据惯例,我们不对 $\theta_{0}$ 进行惩罚。
经过归一化处理的模型与原模型的可能对比如下图所示:

这里写图片描述

如果选择的归一化参数λ过大,则会把所有的参数都最小化了,导致模型变成 $h_{\theta}\left ( x \right )=\theta_{0}$ ,也就是上图中红色直线所示的情况,造成低度拟合。

归一化线性回归(REGULARIZED LINEAR REGRESSION)

归一化线性回归的代价函数为:

这里写图片描述

如果我们要使用梯度下降法令这个代价函数最小化,因为我们未对 $\theta_{0}$ 进行归一化,所以梯度下降算法将分两种情形:

这里写图片描述

对上面的算法中 j=1,2,…,n 时的更新式子进行调整可得:

这里写图片描述

可以看出,归一化线性回归的梯度下降算法的变化在于:每次都在原有算法更新规则的基础上令θ值减少了一个额外的值。
我们同样也可以利用正规方程来求解归一化线性回归模型,方法如下所示:

这里写图片描述

图中的矩阵尺寸为 n+1*n+1。

归一化逻辑回归(REGULARIZED LOGISTIC REGRESSION)

同样对于逻辑回归,我们也给代价函数增加一个归一化的表达式,得到:

这里写图片描述

要最小化该代价函数,通过求导,得出梯度下降算法为:

这里写图片描述

注:看上去同线性回归一样,但是知道 $h_{\theta}\left ( x \right )=g(\theta ^{T}X)$ ,所以与线性回归不同。
Octave 中,我们依旧可以用 fminuc 函数来求解代价函数最小化的参数,值得注意的是参数 $\theta_{0}$ 的更新规则与其他情况不同。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
COURSERA机器学习笔记——归一化(二)

过拟合问题(THE PROBLEM OF OVERFITTING)通过学习得到的假设,可能能够非常好地适应训练集(代价函数可能几乎为 0),但是可能会不能推广到新的数据。下图是一个回归问题的例子: 第一个模型是一个线性模型,低度拟合,不能很好地适应我们的训练集。这个问题的另一个术语叫做高偏差(high bias);第三个模型是一个四次方的模型,过度拟合,虽然能非常好地适应我们的训练集但在新
复制链接

扫一扫

专栏目录

积微成著 CSDN认证博客专家 CSDN认证企业博客

码龄9年

111: 原创

3万+: 周排名

44万+: 总排名

61万+: 访问

: 等级

5546: 积分

167: 粉丝

198: 获赞

64: 评论

616: 收藏

私信

关注

热门文章

分类专栏

Flink 12篇
Kafka 10篇
Redis 2篇
Flume 2篇
笔记
Hadoop 2篇
Big Data 5篇
R 8篇
Java 9篇
Hive 1篇
Web Spider 6篇
Time Series 2篇
Machine Learning 12篇
Statistics 4篇
Pandas 4篇
Linux(Ubuntu16.04) 5篇
Python 33篇
Mysql 4篇
Spark 2篇
Git 2篇

最新评论

Spark——消费Kafka数据保存Offset到Redis
Demon_gu: 哈喽，你的SaveOffsetToRedis类中的第127行中的conn不是被close了嘛？
【Python那些事儿】数据放缩
qq_45915612: 有个函数可以直接用：sklearn.preprocessing.MinMaxScaler
Flink——实战之MySQL Sink
爱吃水果的小昌: 大佬，请教一下这个close方法什么时候被调用呀
【Python那些事儿】数据放缩
沉迷单车的追风少年: [code=csharp] return [round(round((xx - min(x))/(1.0*(max(x) - min(x))), 2)) for xx in x] [/code]
关于Ubuntu16.04中WPS不能输入中文的问题
JeffffWang: 按照博主的方法保存配置文件后，终端会报错：Set document metadata failed: 不支持设置属性 metadata::gedit-spell-language

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。