回归方法分类
一般回归方法 | 根据回归方法因变量的个数不同 | 根据回归函数的类型不同 |
一元、多元 | 线性、非线性 | |
一元线性、一元非线性、多元回归 | ||
两种特殊回归方法 | 逐步回归: 从众多自变量中有效地选择重要变量的方法,确保得到的解释变量集是最优的 | |
Logistic 回归:是一种广义的线性回归分析模型,以指数结构函数作为回归模型的回归方法。 |
回归方法Matlab实现
regress
Multiple linear regression 多元线性回归
常用格式 | ||
用例 | [b, bint, r, rint, s] = regress(Y, X) | |
参数解释 | 输入参数 | y----------相应向量,n维向量 |
x----------对应于回归系数的数据矩阵 | ||
alpha----置信水平(缺省时为0.05); | ||
输出参数 | b---------多元线性回归数值向量的系数估计 | |
bint------b的置信区间 | ||
r----------残差向量 | ||
rint-------r的置信区间 | ||
输出参数的 stats检验统计量 | -----------------回归方程的决定系数(R是相关系数) F-------------------统计量值 p-------------------与统计量值F对应的概率值p ------------------剩余方差 |
fitnlm
Fit nonlinear regression model 拟合非线性回归模型
常用格式 | mdl= fitnlm(x,y,modelfun,beta0) | |
用例 | m1 = @(b,x) b(1) + b(2)*log(x); nonlinfit1 = fitnlm(x,y,m1,[0.01;0.01]) | |
参数解释 | 输入参数 | y----------相应向量,n维向量 |
x----------对应于回归系数的数据矩阵 | ||
modelfun------函数模型 |
stepwise
Interactive stepwise regression 交互式逐步回归
常用格式 | stepwise(x,y,inmodel,penter,premove) | |
用例 | stepwise(X,Y,[1,2,3,4],0.05,0.10) | |
参数解释 | 输入参数 | y----------相应向量,n维向量 |
x----------对应于回归系数的数据矩阵 | ||
inmodel 是自变量x的初始集合的指标 | ||
penter 引入变量时设定的最大p值,缺省时为0.05 | ||
premove 是移出变量时设定的p值,缺省时为0.10 |
fitglm
Create generalized linear regression model 创建广义线性回归模型
mdl = fitglm(x,y,'distribution','binomal') 构建二项式 logistic模型
线性回归结果分析
1. 回归系数置信区间应不包含零点
2. stats统计量:
1) : 的值越接近 1,变量的线性相关性越强,
2)F : 当 F > F1-α(m,n-m-1) ,即认为因变量 y 与自变量 x1,x2,...,xm 之间有显著的线性相关关系;
否则认为因变量 y 与自变量 x1,x2,...,xm 之间线性相关关系不显著。
3)p : 若 p < α(α 为预定显著水平),则说明因变量 y 与自变量 x1,x2,...,xm之间显著地有线性相关关系。
4) 主要用来比较模型是否有改进,其值越小说明模型精度越高。