机器学习笔记——多元梯度下降、正规方程法

最新推荐文章于 2024-11-16 21:43:54 发布

正气的狗子

最新推荐文章于 2024-11-16 21:43:54 发布

阅读量194

点赞数

文章标签：线性代数机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43227482/article/details/120380969

版权

多元梯度下降

定义

房价的线性模型中，原来只有一个房子面积为特征值，此时会有房子层数，卧室数量，使用年数等变量
因此在预测函数中的变量也就相应的增加，但是总的计算过程不会变，仅仅是在迭代的过程中每一步要计算的θ_i值的个数增加。
也正是这样，当特征量很多时，使用梯度下降算法求θ_i仍然是一个很不错的选择。

特征缩放

当x_i的值差距特别大时，建议进行特征缩放，因为这时可能会花费较长的时间，甚至于反复震荡，难以收敛。
最理想的状态是-1<x_i<1，在这个范围左右都可以接受，例如-2<x_i<+1.5，这也是能够接受的范围，但是若是-100<x_i<+100，这就明显区别于前者了。

学习率

学习率正确时，代价函数的值在每次迭代下是逐步下降的。
我们可以通过绘制代价函数的值与迭代次数的函数来判断学习率α的大小是否合适，同时判断自己的代价函数能否收敛得到最终的θ_i。

正规方程

其本质是将原来的函数矩阵化，通过矩阵运算直接得到所有值，在从中选择最优解。
将所有的数据都放入一个矩阵X中，第一列全是1，和梯度下降里一样，x_0 = 1，保证矩阵运算能够成立，将结果放到矩阵Y中。θ_i的值就在这个结果矩阵里。
具体的推导过程大家可以自己去查，俺也是不太懂。
但是正规矩阵的优点就是不需要多次运行，不需要迭代，也不用选择学习率，很直接很暴力，但是面对特征值很多的问题，他的计算量就比较大，运行时间较长，故现阶段大家还是喜欢选择梯度下降的方法。

正气的狗子

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。