机器学习从零开始系列【第三话】多项式回归问题

最新推荐文章于 2024-03-16 22:41:09 发布

JintuZheng

最新推荐文章于 2024-03-16 22:41:09 发布

阅读量280

点赞数

分类专栏： CV方向杂记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rizero/article/details/104141466

版权

CV方向杂记专栏收录该内容

17 篇文章 5 订阅

订阅专栏

特征缩放 (Features scaling)

为什么需要特征缩放？
目的让所有的变量处在一个数量级上，如果某一个变量的数量级和其他的相差太严重会导致收敛太慢，因为我们对每个变量使用的学习率都是一致的。
假如有某个变量的数量级太大，会导致损失函数的梯度图呈现这样扁竖的样子：
没有Feature scaling的梯度图

【解决方法：均值归一化】(Mean normalization)

$X:=\frac{X-avg(X)}{range}$
这样可以把X控制在 $- 0.5 < X < 0.5$

多项式回归

例如：
$h(\theta)=\theta_0+\theta_1x_1+\theta_2x_1+\theta_3x_3....$
如果把变量参数都看作矩阵：
在这里插入图片描述
为什么会有：
$\theta=(X^TX)^{-1}X^Ty$
（注意：这里的 $\theta$ 是矩阵），假设样本总数m=4，特征数n=5。Hypothesis function 可以表示为
$Y=X\theta$
Y=m * 1
X=m * n
$\theta$ =n * 1
$X^T$ =n * m
假如我们需要求 $\theta=X^{-1}Y$ ，但我们不能保证X一定是方阵，可以使用矩阵转置来帮助 $\theta=(X^TX)^{-1}X^Ty$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。