机器学习笔记Day 2

最新推荐文章于 2024-06-19 20:09:01 发布

还是不走寻常路

最新推荐文章于 2024-06-19 20:09:01 发布

阅读量96

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jjflyjm/article/details/97620264

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

机器学习笔记Day 2

多变量线性回归

n ：特征数量

$x^i$ : 训练集中第i个输入特征

$x^i_j$ : 训练集中第i个输入特征的第j个值

假设函数

$h_\theta(x)=\theta_0+\theta_1x_1+...+\theta_nx_n$

其中X可以看成一个(n+1)x1维列向量，其中 $x_0=1$

同样 $\theta$ 也是(n+1)x1维列向量，则上述公式为
$h_\theta(x)=\theta^TX$

多元梯度下降法

假设函数： $h_\theta(x)=\theta_0+\theta_1x_1+...+\theta_nx_n$

参数： $\theta_i$ ，n+1维列向量

代价函数：
$J(\theta)=\frac{1}{2m}\sum_{i=1}^{m}(h_\theta(x^i)-y^i)^2$
梯度下降：
$Repeat:\theta_j=\theta_j-a\frac{∂}{∂\theta_j}J(\theta)$

上图显示了多元梯度下降的过程

特征缩放

让特征在一个相近的范围内

在这里插入图片描述

如果直接用特征的值来画图，会得到左边所示的椭圆图，这会使梯度下降花费更多时间，可能来回振荡，更加缓慢。

所以采用特征缩放能使输入值位于0到1之间。最好的做法是让每个特征值接近[-1, 1]的范围内，当然在这范围外的小幅度波动还是能接受的，安卓老师给出了非常适合的范围[-3, 3], [-1/3, 1/3]最大最小都是可以接受的。

均值归一化

对特征缩放的进一步说明，如何特征缩放，均值归一化！

在这里插入图片描述

如何选择学习率α

学习率太小，会导致梯度下降太慢，太大会导致可能振荡! 在这里插入图片描述

特征和多项式回归。。这一节，对假设函数的选取并不知道遵循什么规则。

正规方程

这有点像高数中的对多元函数求最小值，不过这里是矩阵，刚好不会，后面补补矩阵知识。在这里插入图片描述
正规方程直接求得参数，不用求学习率，不用迭代，还是很方便的，但是，条件是特征数量不大的情况。（n = 1000可以，10000就考虑用梯度下降了）

正规方程在矩阵不可逆情况下的解决方法。。这里我选择性跳过，后面在补。。

还是不走寻常路

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。