lm()求回归方程,confint( )求置信区间,summary( ), anova( )和predict( )等
lm(formula, data, subset, weights, na.action,method="qr", model=TRUE, x=FALSE, y=FALSE,
qr=TRUE, singular.OK=TRUE, contrasts=NULL, offset, ...)
formula是显示回归模型, data是数据框, subset是样本观察的子
集, weights是用于拟合的加权向量, na.action显示数据是否包含缺失值,
method是指出用于拟合的方法, model, x, y, qr是逻辑表达, 如果是TRUE, 应
返回其值. 除了第一个选项formula是必选项, 其它都是可选项.
confint(object, parm, level=0.95, ...)
object是指回归模型, parm要求指出所求区间估计的参数, 默认值为所
有的回归参数, level是指置信水平
1.1一元回归
a.建立数据集,绘制散点图
b.进行回归分析,并在散点图上显示回归直线
c.残差分析,图形诊断。residuals()计算回归方程的残差图,并画出关于残差的散点图> res<-residuals(lm.reg)
> plot(res)
1.2多元回归
a.建立数据集
b.建立多元线性回归方程
c.变量选择与最优回归。step()函数
step(object, scope, scale=0,
step( )函数的调用格式
direction=c("both", "backward", "forward",
trace=1, keep=NULL, steps=1000, k=2, ...)再用summary()提取信息。
1.3回归诊断
1.3.1残差分析
residuals( ), rstandard( )和rstudent( )来计算残差、标准化残差和学生化残差.
> y.res<-residuals(lm.reg) #计算残差
> print(y.res)