Coursera Machine Learning Week 1.2: Linear Regression.one variable

最新推荐文章于 2024-02-25 14:11:51 发布

MatthrewX

最新推荐文章于 2024-02-25 14:11:51 发布

阅读量737

点赞数

分类专栏：机器学习文章标签： linear regression

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013897903/article/details/21151611

版权

机器学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

regression问题是predict real-valued output

classification问题是discrete-valued output

linear regression

这是老师的笔记，cost function就是图中的J(西塔1，西塔2)，也就是说在training data中，要让真实值和regression后得出的值的差的平方和最小，这也是Squared error function。

那么 to minimize the cost function，我们要用到一个算法叫gradient descent，梯度下降。

从图中可以看到，先选择一个西塔0西塔1，然后每次寻找一个梯度最大的方向，也就是斜率最大的方向，往这个方向走一步，然后再同样的走，直到找到一个局部最优值。

这张图表明了gradient descent算法的数学表达，求导表明寻找出梯度最大的那个方向，阿尔法是learning rate，也就是每次要减去的值，西塔0和西塔1要simultaneously update。

而阿尔法的大小也很讲究，下图就说明了原因。

但其实这个阿尔法就算是定值，他也能最后达到收敛，达到局部最优值，因为在一开始这个点上，选择的最大梯度比较大，但是随着越来越接近最优值，这个最大梯度会越来越小，所以没必要变化阿尔法，这个最大梯度会自动变小。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

MatthrewX CSDN认证博客专家 CSDN认证企业博客

码龄11年

152: 原创

76万+: 周排名

129万+: 总排名

8万+: 访问

: 等级

2358: 积分

8: 粉丝

6: 获赞

2: 评论

14: 收藏

私信

关注

热门文章

分类专栏

Java 22篇
机器学习 12篇
统计学习 2篇
找工作经验 1篇
CC150
R语言 1篇
Leetcode 143篇
算法和数据结构 4篇
Python 2篇

最新评论

[Leetcode] 29. Divide Two Integers
夏天的技术博客: leetcode测试时会有-2147483648，如果是这个数字的话，情况就比较特殊了，你不转化为long型就会有问题。因为正数最大为2147483647，所以你的超时应该是死循环了。其次如果是long型最好用labs来取其绝对值。
leetcode难度及面试频率
qweyxy_2: 请问楼主是自己统计的？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。