1.4 机器学习方法之回归问题

回归分析用于预测输入变量和输出变量之间的关系,特别是当输入变量的值发生变化时,输出变量值也随之发生变化。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1. 线性回归

线性回归算法假设特征和结果满足线性关系。这就意味着可以将输入项分别乘以一些常量,再将结果加起来得到输出。
在这里插入图片描述

  • 模型
    选择拟合函数形式 h θ ( x ) = ∑ i = 0 n θ i X i = θ ⊤ X h_{\theta}(x)=\sum_{i=0}^n{\theta_iX_i}=\theta^{\top}X hθ(x)=i=0nθiXi=θX
    用去描述特征里面的分量,比如 x 1 x_1 x1房间的面积, x 2 x_2 x2房间的朝向,等等,做出一个估计函数:
    h ( x ) = h θ ( x ) = θ 0 + θ 1 x 1 + θ 2 x 2 h(x) = h_{\theta}(x) = \theta_0 + \theta_1x_1 + \theta_2x_2 h(x)=hθ(x)=θ0+θ1x1+θ2x2

  • 策略
    确定损失函数形式:
    J ( θ ) = 1 2 ∑ i = 1 m ( h θ ( x ( i ) ) − y ( i ) ) 2 J(\theta) = \frac{1}{2}\sum_{i=1}^m(h_{\theta}(x^{(i)})-y^{(i)})^2 J(θ)=21i=1m(hθ(x(i))y(i))2
    m i n θ J ( θ ) \underset{\theta}{min}J(\theta) θminJ(θ)

  • 算法
    梯度下降法。首先对 θ \theta θ赋值,这个值可以是随机的,也可以让 θ \theta θ是一个全零的向量。
    改变 θ \theta θ 的值,使得 J ( θ ) J(\theta) J(θ) 按梯度下降的方向进行减少,算法的结束将是在 θ \theta θ 下降到无法继续下降为止。
    在这里插入图片描述

1.1 最小二乘法

参见《机器学习之线性回归最小二乘法

1.2 岭回归

岭回归(英文名:ridge regression, Tikhonov regularization)是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法,对病态数据的拟合要强于最小二乘法。

1.3 Lasso回归

Lasso回归是一种压缩估计。它通过构造一个惩罚函数得到一个较为精炼的模型,使得它压缩一些系数,同时设定一些系数为零。因此保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。
适用场景:样本量比较小,但是指标非常多。适用于高维统计,传统的方法无法应对这样的数据。并且Lasso可以进行特征选择。
基本定理。Lasso参数估计被定义如下
在这里插入图片描述
在这里插入图片描述

1.3.1 回归案例:某市财政收入预测

在已有研究的基础上运用Lasso特征选择的方法研究影响地方财政收入的因素,在Lasso特征选择的基础上,使用支持向量回归SVR模型,对选择的特征进行回归分析,得到财政收入的预测模型。案例代码是基于python+pandas+numpy+scikit-learn实现的。
在这里插入图片描述

财政收入数据的基础情况。各项特征名称:社会从业人数x1、在岗职工工资总额x2、社会消费品零售总额x3、城镇居民人均可支配收入x4、城镇居民人均消费性支出x5、年末总人口x6、全社会固定资产投资额x7、地区生产总值x8、第一产业产值x9、税收x10、居民消费价格指数x11、第三产业与第二产业产值比x12、居民消费水平x13。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值