BG:在box-cox变换中,当λ = 0时即为对数变换。
当所分析变量的标准差相对于均值而言比较大时,这种变换特别有用。对数据作对数变换常常起到降低数据波动性和减少不对称性的作用。。这一变换也能有效消除异方差性
library(MASS)
library(openxlsx)
data= read.xlsx("data104.xlsx",sheet = 1) #导入数据
attach(data)
op
plot(size,effort) #图4-4(a)
plot(log(size),log(effort)) #图4-4(b)
#绘制频率分布直方图
hist(effort) #图4-5(a)
hist(size) #图4-5(b)
effor 和 size 这两个变量的频率分布图表明,它们并不满足正态分布。为了接近正态分布,必须变换这些变量(通过频率分布图判断变量是否满足正态分布)
1.先进行基本的线性回归,利用得到的模型进行box-cox变换
lm1=lm(effort~size+t14) #拟合线性回归模型
summary(lm1)
#绘制残差图进行残差分析
plot(fitted(lm1),resid(lm1),cex=1.2,pch=21,col="red",bg="orange",xlab="Fitted value",ylab="Residuals")
boxcox(lm1,lambda=seq(0,1,by=0.