统计学:回归分析

统计模型

统计学要学好,其他的才有的搞。

前言

最近在做信号处理,其中遇到各种小问题,深深地发现自己的统计学知识不够用,于是开始了知识补习之路,但光学没有用,要学以致用,因此写下本系列稿子,造福大家,方便自己。

1回归分析绪论


常用的变量可分为两类:确定性变量,随机变量

确定性变量:两个或多个变量之间有确定的关系,即其中某个变量的每个值,都与某一变量的一个或确定的关系,即其中某个变量的每个值,都与某一变量的一个或几个确定的值相对应,即它们之间存在着函数关系:
y=f(x) y = f ( x )
随机变量:变量对应的不是一个或几个确定的值,而是整个集合的值。这时,变量x和y间的关系,就称为相关关系。
回归分析是一种处理相关关系的数理统计方法,用它可以寻找隐蔽在随机性后面的统计规律性。


2线性回归

线性回归是回归分析里一种常用的方法,也是最简易的方法,本次主讲回归分析:

2.1一元线性回归

一元线性回归处理的是两个变量之间的线性关系:
y=α+βx y = α + β x
对模型参数的估计就是根据原始实验数据:
(x0,y0),(x1,y1),...,(xn ( x 0 , y 0 ) , ( x 1 , y 1 ) , . . . , ( x n 1 1 ,yn , y n - 1) 1 )

确定 αβ α 和 β 的估计值。
在实际体系中,可能自变量x与因变量y并不服从线性关系,但可以转化为线性关系处理:
f2(x,y)=α+βf1(x,y) f 2 ( x , y ) = α + β f 1 ( x , y )
其中, f1,f2 f 1 , f 2 是 不 含 待 定 系 数 的 已 知 函 数 。
任一实验点 (xi,yi) ( x i , y i ) 可能没有恰好落在直线上,误差 δi δ i :
δi=yiαβxi(i=0,1,...,n1) δ i = y i − α − β x i ( i = 0 , 1 , . . . , n − 1 )
误差 δi δ i 反映了 xi,yi x i , y i 这组实验数采集时各种影响因素的总和。

要寻找一条最靠近各个数据点的直线——回归直线,最小二乘法即是残差的平方和最小,残差平方和Q为:
Q=n1i=0δ2i Q = ∑ i = 0 n − 1 δ i 2
求解的matlab实现可以参照我那一篇帖子:
matlab最小二乘法

——————————

公式求解:
定义:

x¯¯¯=1nn1i=0xi x ¯ = 1 n ∗ ∑ i = 0 n − 1 x i y¯¯¯=1nn1i=0yi y ¯ = 1 n ∗ ∑ i = 0 n − 1 y i

x¯¯¯,y¯¯¯xiyi x ¯ , y ¯ 分 别 是 x i 和 y i 的 平 均 值

xix¯¯¯xix¯¯¯xi x i 和 x ¯ 的 偏 差 ( x i − x ¯ ) 称 为 x i 的 离 差


OLS的F检验

误差与测量有关,误差大小可以衡量测量的准确性,误差越大表示测量越不准确。误差分为两类:系统误差与随机误差。其中,系统误差与测量方案有关,通过改进测量方案可以减小系统误差。随机误差与观测者,测量工具,被观测物体的性质有关,只能尽量减小,却不能避免。
残差――与预测有关,残差大小可以衡量预测的准确性。残差越大表示预测越不准确。残差与数据本身的分布特性,回归方程的选择有关。
随机误差项Ut反映除自变量外其他各种微小因素对因变量的影响。它是Y t 与未知的总体回归线之间的纵向距离,是不可直接观测的。
残差e t 是Yt 与按照回归方程计算的Yt 的差额,它是Yt 与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算et 的具体数值。利用残差可以对随机误差项的方差进行估计。

随机误差是方程假设的,而残差是原值与拟合值的差。实践中人们经常用残差去估计这个随机误差项。残差一般只的是在计算近似值过程中某一步与真实值得差值,而误差指的的是最终近似值与真实值得差值。
残差就是回归所得的估计值与真值(实际值)之间的误差;修正的R square就是剔出了数据量影响后的R2。
最小二乘平差通过使观测值的残差的平方和最小方法使观测值纳入模型。这些残差即为最小二乘平差改正数。
F-检验通常称为整体模型检验,因为它从总体上对模型进行了检验。
F值由如下表达式给出:
F=s2a2 F = s 2 a 2
其中
s2 s 2 = 为后验方差因子,取决于计算的残差和多余观测;
a2 a 2 = 为先验方差因子。


参看文献:
残差检验
最小二乘法与回归分析

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值