r语言boxcox异方差_基于R语言进行Box-Cox变换

本文介绍了如何使用R语言进行Box-Cox变换,这是一种用于连续响应变量非正态分布情况的统计转换。通过计算最佳变换参数λ,文章展示了从数据加载、线性模型构建、残差正态性检查到最终的Box-Cox转换过程,以改善残差的正态分布特性。
摘要由CSDN通过智能技术生成

原标题:基于R语言进行Box-Cox变换

作者简介

作者:吴健中国科学院大学 R语言、统计学爱好者,尤其擅长R语言和Arcgis在生态领域的应用分享

个人公众号:统计与编程语言

Q:

为什么要进行Box-Cox转换?

A:

Box-Cox是一种广义幂变换,统计建模中常用的变换,用于连续响应变量不满足正态时的情况。Box-Cox的一个显著的有点是通过求变参数λ来确定变换形式,而这个过程完全基于数据本身而无需任何先导信息,这比凭经验的对数,平方根变换更客观。

Box-Cox变换公式如下:

y必须取正值,y值为负,首先y+a,对不同的λ所做的变换不同。λ=0对数变换;λ=-1倒数变换;λ=0.5平方根变换。

下面本文将介绍基于R语言进行Box-Cox转换。

STEP1:加载程序包并读取数据

library(readxl)#此包可以读取电子表格数据

library(moments)#此包可进行偏度锋度计算

library(MASS)#基于此包进行box-cox转换

data

STEP2:构建线性模型并检查残差是否满足正态分布

r1

hist(r1$residuals)#绘制残差频率分布图

skewness(r1$residuals)#计算偏度 结果1.89

通过残差频率分布图和偏度值可以发现残差并不满足正态分布。

STEP3:进行Box-Cox转换,确定λ值

b

b

lambda

lik

bc

bc[order(-lik),]#结果λ=-0.3时lik值最大,因此λ取值-0.3

STEP4:依据步骤3确定的λ值进行转换,并检查残差的正态性

r2

hist(r2$residuals)

skewness(r2$residuals)#结果-0.89

通过上述转换,可以看出残差分布已经近似正态了。

文中数据

链接:

https://pan.baidu.com/s/123pM4Z3rXeGKI1DSOtgTPQ

提取码:fj8h

复制这段内容后打开百度网盘手机App,操作更方便哦返回搜狐,查看更多

责任编辑:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值