机器学习(三)------多元线性回归

本文介绍了多元线性回归的概念,以房价预测为例,解释了多个特征变量如何预测目标值。接着,详细阐述了多元梯度下降法的代价函数及更新规则,并讨论了特征缩放对算法效率的影响。此外,文中提到了判断梯度下降算法收敛的两种方法,以及学习率α的选择策略。最后,探讨了特征选择和多项式回归,提出了通过特征组合增强模型拟合能力。
摘要由CSDN通过智能技术生成

  一、定义

       我们依旧以房价预测为例,生活中,决定房价的不仅仅是面积一个特征,可能还与楼层等许多因素有关,当有多个特征时,假设函数为:h(x)=θ0+θ1x1+θ2x2+.....+θnxn

为了方便定义,我们假设有x0=1,这样假设方程就可以写为:

x=\begin{bmatrix} x0\\ x1\\ ...\\ xn\\ \end{bmatrix}          \theta =\begin{bmatrix} \theta 0\\ \theta 1\\ ...\\ \theta n\\ \end{bmatrix}               h(x)=θ^{t}xθ^{t}x\theta^{T}x

这就是所谓的多元线性回归,也就是用多个特征变量来预测y值。

二、多元梯度下降法

1.代价函数:(θ表示向量)

J(\theta )=\frac{1}{2m}\sum_{m}^{i=1}(h(x^{i})-y^{i})^{2}

2.与(二)相同,只是要同时更新n个θ

三、特征缩放

   用一定的方法,将数据特征缩小到某个范围内,通过特征缩放使梯度下降的速度变快,收敛所需的迭代次数更少

四、如何判断梯度下降算法已经收敛

1、绘制一个J(θ)随迭代发生的变化曲线,y轴表示J(θ)大小,x轴表示迭代次数,通过图像观察收敛是否完成。

2、通过算法:例如,J(θ)经过一次迭代后只下降了很小的ε,就说明已经收敛,ε的值自行规定,可以为10^{-3}等等,但由于这个阈值很难确定,因此我们通常还是使用图像判断。

五、学习率(learning date)α的选择

        数学研究表明,只要α足够小,梯度一定会下降。但也不能选择太小的α,这样会导致梯度下降过慢,需要迭代很多次才能找到最小值。

六、特征选择和多项式回归

可以通过对一个特征曲线做变化,拟合出一个二元函数或三元函数等等。

对于特征的选择,我们有时可以将两个特征相乘(或其他变化),让他们合并成一个特征。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值