R语言代码总结
应用回归分析 何晓群编著
R软件读取数据
#方法一
x<-c(1,2,3,4,5,6,7,8,9) #生成数值向量x并赋值
y<-c(100,200,300,400,500,600,700,800,900) #生成数值向量y并赋值
#方法二
data1 <- read.csv("F:/RStudio/数据/data1.csv",head=TRUE)
注:<-是赋值符号,也可用=代替
第2章 一元线性回归
data2.2<-read.csv("F:/data2.2.csv",head=TRUE)
attach(data2.2) #将数据框添加到R的搜索路径
data_outline=c(mean(x),sd(x),mean(y),sd(y)) #计算变量x和y的均值和方差
data_outline
cor.test(x,y) #x与y相关系数的显著性检验
lm2.2=lm(y~x,data=data2.2) #建立回归方程及其显著性检验
anova(lm2.2) #输出线性回归的方差分析表
summary(lm2.2) #输出回归方程及显著性检验结果
confint(lm2.2) #计算回归系数95%的置信区间
SRE=rstandard(lm2.2) #计算学生化残差
plot(x,SRE,xlab="城镇居民人均收入",ylab="学生化残差") #绘制残差散点图
detach(data2.2) #与attach()相对应,将数据框从搜索路径中移除
第3章 多元线性回归
data3.2<-read.csv("F:/data3.2.csv",head=TRUE) #读取数据
lm3.2=lm(y~x1+x2,data=data3.2) #建立回归方程
summary(lm3.2)
r=cor(data3.2) #计算相关系数阵
r
install.packages("corpcor") #安装corpcor包
library(corpcor) #加载corpcor包
pcor3.2=cor2pcor(r) #由相关系数阵计算偏相关系数阵
pcor3.2
data3.11 <- read.csv("F:/RStudio/数据/data3.11.csv",head=TRUE) #读取数据
lm3.11<-lm(y~x1+x2+x3,data=data3.11) #建立回归方程
summary(lm3.11)
r<-cor(data3.11) #计算相关系数矩阵
r
lm3.11_drop3<-lm(y~x1+x2,data=data3.11) #剔除x3,建立新的回归方程
summary(lm3.11_drop3)
confint(lm3.11_drop3,level=0.95)
sd.data3.11<-scale(data3.11,center=TRUE,scale=TRUE) #对各列数据进行标准化
sd.lm3.11_drop3<-lm(y~x1+x2,data=data.frame(sd.data3.11))
summary(sd.lm3.11_drop3)
ypred<-predict(lm3.11_drop3,newdata=data.frame(x1=75,x2=42),interval='prediction',level=0.95)
ypred #当x1=75,x2=42,x3=3.1,置信区间为95%时,y0^的精准置信区间