coursera Machine Learning Week2 学习笔记

最新推荐文章于 2022-02-14 23:41:13 发布

Love_Tea_Cat

最新推荐文章于 2022-02-14 23:41:13 发布

阅读量1.6k

点赞数

分类专栏： coursera Machine Learning 文章标签： coursera machine learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/love_tea_cat/article/details/25625751

版权

coursera Machine Learning 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Part4: Linear Regression with Multiple Variables

进入多变量线性回归~在看视频的时候发现了视频里面的一个错误:在Normal Equation的第8分钟左右,那个x的上下标写反了,应该是上标为1,2,3,4,下标一直为1.

多变量线性回归其实就是在单变量线性回归的基础上进行推广，很多公式都是直接在单变量线性回归的基础上进行矩阵化的改写，下面列出多变量线性回归的公式。

首先是假设函数：

这里第二个公式就是矩阵化的一个写法，θ为一个n+1*1的矩阵，X为一个n+1*m的矩阵（X在原来的基础上在左边加上一列X0=1,另m为元组个数）。

接下来是代价函数，仍然和单变量线性回归一样：

最后是梯度下降法的更新公式，偏导求导之前的公式和单变量线性回归一致：

如果把偏导求解出来的话，

好了，基本上公式没有太大的变化。这部分视频中还讲解了一些其他的部分：

数据缩放：简单的来说就是数据的规范化的一种。如果一个属性中数值的范围是1~2000，另一个属性中数值的范围是1~5，那么可以想象这对于计算的时候肯定非常的不方便，算法的运算效率也会降低，所以需要把一些范围很大的数据进行规范化，课程中介绍的方法是

其实还有很多数据规范化的方法，比如z分数规范化：

其中A为x的均值，σ为x的标准差；

以及小数定标规范化：

其中j是使得max(|x'|)<1的最小整数。

Learning rate的选择：在梯度下降法中，一个合适的Learning Rate应该能够让代价函数不断的减少，如果发现代价函数不降反升，那么很有可能就是Learning rate过大。同时如果Learning rate过小，会导致算法的运行效率缓慢。如何找到一个合适的Learning rate呢？课程中教授的方法是0.001，0.003，0.01，0.03，0.1，0.3，1这样不断的尝试，每次将上次的Learning rate*3。

Normal Equation：使用最小二乘法的方法进行θ的计算，公式为

课程没有给出证明……我尽力尝试下能否给出这个公式的证明。另外Normal Equation的好处就是无需选择Learning rate，无需迭代，一次完成，在维度n较小(课程中给出的阀值为10000)的时候运算速度比较快，但是后面的很多算法无法应用；而梯度下降法则是相反，而且后面的很多算法需要以梯度下降法作为基础。另如果发现矩阵不可转置，一种可能是x的属性中存在重复(同一个量不同单位比如米和英尺)，或者m<n，m为元组个数，n为属性个数。

Part 5:Octave Tutorial

介绍Octave的基本用法，这里就不再阐述。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。