Coursera Machine Learning Week2 学习笔记

注:本文已迁移至:http://blog.csdn.net/JinbaoSite/article/details/66530379

四、多变量线性回归(Linear Regression with Multiple Variables)

4.1 多变量线性回归模型

(1) Hypothesis

hθ(x)=θ0+θ1x1+θ2x2+θ3x3++θnxn

设定 x0=1 ,那么
hθ(x)=θ0x0+θ1x1+θ2x2+θ3x3++θnxn=[θ0θ1θn]x0x1xn=θTx

(2) Parameters
θ0,θ1,θ2,θ3,,θn

(3) CostFunction
J(θ0,θ1,,θn)=12mi=1m(hθ(x(i))y(i))2

4.2 多变量线性回归(Gradient Descent For Multiple Variables)

跟单变量线性回归类似:

}repeat until convergence:{θ0:=θ0α1mi=1m(hθ(x(i))y(i))x(i)0θ1:=θ1α1mi=1m(hθ(x(i))y(i))x(i)1θn:=θnα1mi=1m(hθ(x(i))y(i))x(i)n

简化得:
}repeat until convergence:{θj:=θjα1mi=1m(hθ(x(i))y(i))x(i)jfor j := 0...n

4.3 特征缩放(Feature Scaling)

1、特征缩放:如果有多个变量的值在一个相近的范围内,那么我们可以将它们缩放在一个更小的范围内,将使得梯度下降算法更快地收敛。
2、特征缩放的方法:

si:=max(x0,x1,,xn)xi:=xisi

2、例子

左边比右边需要更多的步数来到达最低点。
3、通常情况下,我们进行特征缩放的时候,尝试将所有特征的尺度都尽量缩放在-1到1之间。如果不在-1到1之间也是可以,并没有明确的要求,但不要太大或者太小了。

4.4 均值归一化(mean normalization)

均值归一化是数值一般化(Feature Normalization)的另一种方式,原理和作用跟特征缩放一致。
ui :特征变量的平均值
si :特征变量的最大值-最小值

xi:=xiμisi

4.5 学习率 α

如果我们的学习率 α 选择合适的话,我们会得到下面以梯度下降的迭代次数为横坐标的曲线图

如果学习率 α 太大,那么结果可能是下面两种情况,我们这个时候需要选择更小一点的学习率 α


所以,梯度下降算法的每次迭代收到学习率的影响,如果学习率 α 过小,则达到收敛所需的迭代次数会非常高,如果学习率 α 过大,每次迭代可能不会减小代价函数,可能会越过局部最小值导致无法收敛。

4.6 多项式回归(Polynomial Regression)

线性回归并不适用于所有数据,有时候我们需要曲线来适应我们的数据。
假如有一个三次方模型 hθ(x)=θ0+θ1x1+θ2x21+θ3x31 ,为了便于使用线性回归来解决,我们做如下变换

hθ(x)=θ0+θ1x1+θ2x21+θ3x31y1=x1y2=x21y2=x21hθ(y)=θ0+θ1y1+θ2y2+θ3y3

这个时候特征缩放就很有必要了。

五、正规方程(Normal Equation)

5.1 正规方程

对于方程 J(θ0,θ1,,θn)=12mi=1m(hθ(x(i))y(i))2 为了求 J(θ0,θ1,,θn) 最小值,我们利用数学方法来求解,对所有的变量求偏导数,令偏导数 J(θ)θj=0 ,求出 (θ0,θ1,,θn) 使得 J(θ0,θ1,,θn) 最小。
求解结果为

θ=(XTX)1XTy

5.2 梯度下降与正规方程比较

梯度下降正规方程
需要选择学习率 α 不需要
需要多次迭代一次运算得出
当特征数量n大时也能很好使用需要计算出 (XTX)1 ,如果特征数量n较大则运算代价大,通常来说当n小于10000时还是可以接受的
适用于各种类型的模型只适用于线性模型,不适合逻辑回归模型等其他模型
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Coursera机器学习是由斯坦福大学教授Andrew Ng主讲的一门在线课程,旨在向学习者介绍机器学习的基本概念、算法和应用。该课程涵盖了监督学习、无监督学习、深度学习等多个方面,通过理论讲解和实践编程作业,帮助学习者掌握机器学习的基本原理和实践技能。该课程是Coursera平台上最受欢迎的课程之一,也是机器学习领域入门的重要资源之一。 ### 回答2: Coursera机器学习是由斯坦福大学Andrew Ng教授设计并教授的在线课程。这门课程被认为是公认的机器学习入门教材之一,也是Coursera平台最受欢迎的课程之一。 这门课程涵盖了机器学习领域中最基础的知识和技术,包括监督学习、无监督学习以及神经网络等。学生可以通过该课程了解到如何采集和处理数据、如何训练模型、如何评估模型的性能等。此外,课程还涉及到机器学习中一些实用的技术,如正则化、梯度下降等。 该课程受到了全球范围内的认可和青睐,许多学生、工程师、数据科学家等都受益于该课程。由于该课程的知识点全面、深入浅出、容易理解和学习,在业内和学术界都广受赞誉,拥有较高的知名度和价值。 总之,Coursera机器学习是一门非常好的课程,对于那些对机器学习感兴趣的人来说,它是一个不可错过的机会。课程教材内容丰富、难度适中,且教学相对轻松愉悦,难怪在学习资源上产生了广泛的影响。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值