4、多个特征变量的线性回归

4、多个特征变量的线性回归

4.1多功能

n是样本特征数量
x ( i ) x^{(i)} x(i)是第i个训练样本的特征值(包括每个特征),相当于一个向量
x j ( i ) x^{(i)}_j xj(i)是第i个训练样本中的第j个特征量的值

多元线性回归:
h θ ( x ) = θ 0 ∗ x 0 + θ 1 ∗ x 1 + θ 2 ∗ x 2 + … + θ n ∗ x n ( x 0 = 1 ) h\theta(x)=\theta_0*x_0+\theta_1*x_1+\theta_2*x_2+…+\theta_n*x_n(x_0=1) hθ(x)=θ0x0+θ1x1+θ2x2++θnxn(x0=1)
θ = [ θ 0 θ 1 θ 2 … θ n ] (2) \theta= \begin{bmatrix} \theta_0 \\ \theta_1\\ \theta_2\\ …\\ \theta_n \end{bmatrix} \tag{2} θ= θ0θ1θ2θn (2)
x = [ x 0 x 1 x 2 … x n ] (2) x= \begin{bmatrix} x_0 \\ x_1\\ x_2\\ …\\ x_n \end{bmatrix} \tag{2} x= x0x1x2xn (2)
h θ ( x ) = θ T ∗ x h\theta(x)=\theta^{T}*x hθ(x)=θTx

4.2多元梯度下降法

4.3特征缩放

数量级的差异将导致量级较大的属性占据主导地位
数量级的差异将导致迭代收敛速度减慢
我们需要把数据处理在相近似的取值范围内

均值归一化:
x i = x i − u i s i x_i=\frac{x_i-u_i}{s_i} xi=sixiui
u i u_i ui:该特征所有样本的平均值
s i s_i si:标准差,即最大值-最小值
处理后的数据均值为0,标准差为1

4.4如何取学习率

纵轴是 J ( θ ) J(\theta) J(θ)的取值,横轴是迭代次数,该图可以帮助我们判断梯度下降算法是否收敛,是否正常工作
在这里插入图片描述

自动收敛测试:通过设定一个特定的阀值,当在某次迭代中 J ( θ ) J(\theta) J(θ)减小小于阀值,则声明收敛


非正常收敛
在这里插入图片描述


α \alpha α过小,收敛过慢, α \alpha α过大,可能不收敛
在这里插入图片描述

尝试一系列 α \alpha α值,绘制 J ( θ ) J(\theta) J(θ)随迭代次数变化曲线,选择使 J ( θ ) J(\theta) J(θ)快速下降的一个 θ \theta θ值,将其作为我们较为合适的学习率

4.5特征选择和多项式模型

特征选择目的:
● 减少训练数据大小,加快模型训练速度。

● 减少模型复杂度,避免过拟合。

● 特征数少,有利于解释模型。

● 如果选择对的特征子集,模型准确率可能会提升。
在这里插入图片描述

在上图例子中,通过定义Area(frontage × \times ×depth)新的特征,简化了模型


利用其它多项式模型来更好地拟合数据
在这里插入图片描述

对次方的处理实际上是先对特征变量进行处理
在这里插入图片描述

目的:为了更好地拟合我们的样本数据变化图像,我们可根据我们所了解的多项式函数的变化图像,来构建多项式模型来构建更好、更加拟合数据的模型
例如上图,为了保证模型后半段不像二次多项式模型后半段呈下降趋势,我们可以选择三次多项式模型或是平方根多项式模型

4.6正规方程(区别于迭代法的直接解法)

正规方程相当于找到模型的极小值点(求导为0)
在这里插入图片描述

但一个个遍历每个 θ \theta θ参数的偏导显然是麻烦的,所以我们选择下面的公式进行计算
在这里插入图片描述

在这里插入图片描述

X被称为设计矩阵
正规方程:
θ = ( X ∗ X T ) − 1 ∗ X T ∗ y \theta=(X*X^{T})^{-1}*X^T*y θ=(XXT)1XTy
θ \theta θ即为我们需要的参数矩阵


如何选择梯度下降法和正规方程
1、梯度下降法
缺点:需要选择学习速率 α \alpha α,额外工作;需要迭代,计算速度较慢
优点:对于多特征变量(n大)仍能很好地运作
2、正规方程
缺点:对于多特征变量(n大)计算会很慢
优点:不用选择 α \alpha α;不需要迭代

通常情况,n大于10000考虑梯度下降,小于10000考虑正规方程


正规方程矩阵不可逆情况:
在这里插入图片描述

两种情况:
1、有多余的特征变量——>删除多余特征变量
2、特征变量过多——>在影响不大的情况下,删除一些特征变量或考虑使用正规化方法

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值