斯坦福机器学习课学习笔记(一)-梯度下降

本讲内容:

  • 线性回归
  • 梯度下降
  • 正规方程组

  • 线性回归
首先看一组关于房价的数据,该数据集只有一个特征。
living areas(feet2) price($1000s)
2104 400
1416 232
1534 315
852 178
1940 240
.. ..

下面 介绍几个符号概念:
 = 训练样本数量
  = 输入变量/特征
  = 输入变量/目标值
= 训练样本
= 第个训练样本

监督学习的一般流程:


在该数据集上,假设

为了使问题更有趣,引入房间数的特征,则为房屋面积,为房间数,那么有
living areas(feet2) #bed rooms price($1000s)
2104 3 400
1416 2 232
1534 2 315
852 1 178
1940 3 240
.. .. ..


为简便起见,令,则有

n为特征数, 为参数集。

然后,令
目标是
首先,我们将从某个值开始(比如说零向量),然后不断更新以减小

  • 梯度下降算法

更新的算法称之为梯度下降算法,其思想如下:


因此,按的方式更新,直到收敛。
以以上推导为基础,分别有批处理梯度下降和随机梯度下降算法两种方法。
批处理梯度下降算法:

----------------------------------------------------
随机梯度下降算法:
 
{
for j =1 to m
{
(for all i)
}
}

批处理和随机梯度下降算法的比较:
批处理梯度下降算法每次更新需要对所有的训练集进行计算,计算量较大。
而随机梯度下降算法每次更新只用一组训练数据,收敛时会在最小值附近徘徊。

  • 正规方程式

下面介绍第二种最小化的方法。

对一个由mxn的矩阵映射到实数的函数f,可以这样定义,f对A的导数为:

如果,则
下面不加证明地陈述几个事实:







if 



最小二乘法回顾
为推导方便,设计下面几个符号。



因为









  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值