R语言进行Box-Cox变换

R语言进行Box-Cox变换

为什么要进行Box-Cox转换

Box-Cox是一种广义幂变换,统计建模中常用的变换,用于连续响应变量不满足正态时的情况。Box-Cox的一个显著的有点是通过求变参数λ来确定变换形式,而这个过程完全基于数据本身而无需任何先导信息,这比凭经验的对数,平方根变换更客观。

Box-Cox变换公式

其中,y必须取正值,y值为负,首先y+a,对不同的λ所做的变换不同。λ=0对数变换;λ=-1倒数变换;λ=0.5平方根变换。

基于R语言进行Box-Cox转换

STEP1:加载程序包并读取数据
library(readxl)#此包可以读取电子表格数据
library(moments)#此包可进行偏度锋度计算
library(MASS)#基于此包进行box-cox转换
data<-read_excel(file.choose())#读取特定文件夹中的数据

STEP2:构建线性模型并检查残差是否满足正态分布
r1<-lm(y~x1+x2+x3+x4, data=data)#构建多元线性回归模型
hist(r1KaTeX parse error: Expected 'EOF', got '#' at position 11: residuals)#̲绘制残差频率分布图 skewn…residuals)#计算偏度

通过残差频率分布图和偏度值可以发现残差并不满足正态分布。

STEP3:进行Box-Cox转换,确定λ值
b <- boxcox(y ~ x1 + x2 + x3 + x4, data=data)
b
lambda <- b x l i k < − b x lik <- b xlik<by
bc <- cbind(lambda, lik)
bc[order(-lik),]#结果λ=-0.3时lik值最大,因此λ取值-0.3

STEP4:依据步骤3确定的λ值进行转换,并检查残差的正态性
r2 <- lm(1/y^(1/3) ~ x1 + x2 + x3 + x4, data=data)
hist(r2 r e s i d u a l s ) s k e w n e s s ( r 2 residuals) skewness(r2 residuals)skewness(r2residuals)#结果-0.89

通过上述转换,可以看出残差分布已经近似正态了。

  • 6
    点赞
  • 62
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

上官峰晨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值