线性回归基础知识

线性回归定义

        线性回归属于机器学习中监督学习的范畴。其训练集中的数据一般拥有多个输入变量(也称特征)和一个输出变量,我们对训练集中的数据进行拟合,得到一条近似曲线,并输出为确定的连续函数,即预测函数,是一个从输入变量x到输出变量y的关系函数。然后就可以使用该预测函数对输入的数据进行结果预测。

        如上图所示,红叉表示训练集中数据的坐标,蓝色线即为拟合的预期函数曲线。


预测函数及代价函数

        假设回归模型中的数据只有一个输入变量,即只有一个特征,以房屋估价为例,特征为房屋尺寸,输出为该房屋的估价,此时为简单回归问题。假设训练集中有m个样本(X^{(i)},Y^{(i)}),即m组房屋尺寸和对应房屋估价的数据,计算机要根据这些样本来拟合出贴合样本点的预测函数 h_{\Theta }(x)。设预测函数为 h_{\Theta }(x)=\Theta _{0}+\Theta_{1}x。不同的参数\Theta_{0} 和\Theta_{1} 的取值,会产生不同的预期函数,而他们与训练集数据的贴合程序也不同,如下图所示。

        我们定义“代价”为预测函数所预测的结果相比真实结果的误差,要使预测函数拟合的更好,那么就要使代价更小。接着我们引入代价函数J(\Theta) ,即当预测函数的参数取不同值的时候,代价的变化趋势。代价函数的具体数学表示可以有很多种,其中应用广泛的一种为:使预测值h_{\Theta}(x) 与实际值 y^{i} 的差的平方最小,下面给出这种代价函数的数学表示:

         其中 m 为训练集的样本数,h(x^{(i)}) 为预测函数对第 i 个样本的预测结果,y^{i} 为第 i 个样本的真实结果。我们需要找到合适的参数\Theta_{0} 和 \Theta_{1} 来使该代价函数值最小。当预测函数中只有一个参数\Theta_{1} 时,该代价函数的为一个二次函数,函数图像大致如下:

        如上图所示,该代价函数在最低点时参数\Theta_{1} 的取值,即为最优的预测函数参数取值。

        但当有两个参数\Theta_{0} 和\Theta_{1} 时,代价函数就会更加复杂,呈现为三维立体图像。

        图像的高度为代价值,可以看出,此时代价函数仍存在最小值。而该三维立体图像也可以化为等高线图:

        其中椭圆形的中心即为代价函数的最低点,也就是预测函数参数的最优取值点。当参数更多时,代价函数就无法可视化了。

        上述介绍的这个代价函数即为均方误差函数(MSE),被广泛运用于回归问题中,对于大多数的回归问题它都表现得很好。找到使代价函数值最小时的的参数\Theta_{0} 、\Theta_{1}、...\Theta_{n} 的取值的过程,称为代价函数的最小化。所以线性回归要做的就是:定义合适的预测函数,并将代价函数最小化,得到确定的预测函数。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SPSS是一种常用的统计分析软件,其中的多元线性回归分析功能可以用于研究多个自变量对一个因变量的影响关系。当进行多元线性回归分析时,有时候需要排除一些变量,即在分析中不考虑这些变量对因变量的影响。 排除变量解读可以通过多元线性回归分析的输出结果来实现。首先,我们需要注意到SPSS输出表中的“模型摘要”一栏。其中的F值表示整个模型的显著性,如果F值的P值小于设定的显著性水平(通常为0.05),则可以认为整个模型有显著影响。如果整个模型不显著,那么我们无需进行后续的排除变量操作。 接下来,我们需要关注SPSS输出表中的“回归系数”的一栏。在这一栏中,我们可以看到自变量对因变量的回归系数和它们的显著性水平。如果某个自变量在回归模型中的回归系数不显著(通常P值大于0.05),那么我们可以排除这个自变量。这意味着在解读时,我们可以不考虑这个变量对因变量的影响。 在排除变量之后,我们可以重新运行多元线性回归分析,并且关注更新的模型摘要和回归系数。如果排除了某个变量之后,模型整体显著性提高了(F值的P值更小),或者新模型中的回归系数更加显著,那么我们可以认为排除该变量是有效的。 需要注意的是,排除变量不应该基于统计显著性的结果而盲目进行。我们还应该考虑理论基础和实际背景知识,以避免过度解读统计结果。因此,在解读多元线性回归模型时,需要综合考虑统计显著性和实际背景知识,充分理解模型的解释力和可靠性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值