Coursera Machine Learning Week 1.2: Linear Regression.one variable

MatthrewX

于 2014-03-13 11:09:17 发布

阅读量732

点赞数

分类专栏：机器学习文章标签： linear regression

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013897903/article/details/21151611

版权

机器学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

regression问题是predict real-valued output

classification问题是discrete-valued output

linear regression

这是老师的笔记，cost function就是图中的J(西塔1，西塔2)，也就是说在training data中，要让真实值和regression后得出的值的差的平方和最小，这也是Squared error function。

那么 to minimize the cost function，我们要用到一个算法叫gradient descent，梯度下降。

从图中可以看到，先选择一个西塔0西塔1，然后每次寻找一个梯度最大的方向，也就是斜率最大的方向，往这个方向走一步，然后再同样的走，直到找到一个局部最优值。

这张图表明了gradient descent算法的数学表达，求导表明寻找出梯度最大的那个方向，阿尔法是learning rate，也就是每次要减去的值，西塔0和西塔1要simultaneously update。

而阿尔法的大小也很讲究，下图就说明了原因。

但其实这个阿尔法就算是定值，他也能最后达到收敛，达到局部最优值，因为在一开始这个点上，选择的最大梯度比较大，但是随着越来越接近最优值，这个最大梯度会越来越小，所以没必要变化阿尔法，这个最大梯度会自动变小。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Coursera Machine Learning Week 1.2: Linear Regression.one variable

regression问题是predict real-valued outputclassification问题是discrete-valued outputlinear regression这是老师的笔记，cost function就是图中的J(西塔1，西塔2)，也就是说在training data中，要让真实值和regression后得出的值的差的平方和最小，
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。