Matlab 实现多元回归实例
(一)一般多元回归
一般在生产实践和科学研究中,人们得到了参数(),,n x x x =???1和因变量y 的数据,需要求出关系式()y f x =,这时就可以用到回归分析的方法。如果只考虑
f 是线性函数的情形,当自变量只有一个时,即,(),,n x x x =???1中n =1时,称
为一元线性回归,当自变量有多个时,即,(),,n x x x =???1中n ≥2时,称为多元线性回归。
进行线性回归时,有4个基本假定: ① 因变量与自变量之间存在线性关系; ② 残差是独立的; ③ 残差满足方差奇性; ④ 残差满足正态分布。
在Matlab 软件包中有一个做一般多元回归分析的命令regeress ,调用格式如下:
[b, bint, r, rint, stats] = regress(y,X,alpha) 或者
[b, bint, r, rint, stats] = regress(y,X) 此时,默认alpha = 0.05. 这里,y 是一个1n ?的列向量,X 是一个()1n m ?+的矩阵,其中第一列是全1向量(这一点对于回归来说很重要,这一个全1列向量对应回归方程的常数项),一般情况下,需要人工造一个全1列向量。回归方程具有如下形式:
011m m y x x λλλε=++???++
其中,ε是残差。
在返回项[b,bint,r,rint,stats]中, ①01m b λλλ=???是回归方程的系数;
②int b 是一个2m ?矩阵,它的第i 行表示i λ的(1-alpha)置信区间; ③r 是1n ?的残差列向量;
④int r 是2n ?矩阵,它的第i 行表示第i 个残差i r 的(1-alpha)置信区间; 注释:残差与残差区间杠杆图,最好在0点线附近比较均匀的分布,而不呈现一定的规律性,如果是这样,就说明回归分析做得比较理想。
⑤ 一般的,stast 返回4个值:2R 值、F_检验值、与显著性概率相关的p 值、残差的方差(前两个越大越好,后两个越小越好)。