【定量分析、量化金融与统计学】R语言ANOVA方差分析关于outliers(异常值)的处理

这是一个短篇,主要用于补充上一篇ANOVA假设检验的问题。

在ANOVA中,假设检验不仅仅要包括上一篇中所说的那三类。还会有异常值检验,就是所说的outliers。

我们可以看一下boxplot中的异常值:

 这些地方在正态检验的时候是存在异常值的,那么我们为了数据的健康,这些异常值必须要拿掉,那么我们用R语言走一遍流程。

outliersx6<-boxplot(x6 ~ x1, data = x,
                    xlab = "customer type", ylab = "product quality",
                    main = "compare", col = c("#00AFBB", "#E7B800", "#FC4E07")
                    , names=c("<1 year","1-5 years",">5 years") )
print(outliersx6)

我们直接使用boxplot对outliers变量赋值就能看到outliers,

 我们看看结果:

 就会出现一个叫out的属性,保存着异常值,那么我们开始剔除他们。

out1<-x[x$x1==3 & x$x6==7.6,]
print(out1)
out2<-x[x$x1==1 & x$x6==9.5,]
print(out2)

outAll<- rbind(out1,out2)
print(outAll)

x<-x[-which(x$id %in% outAll$id),]

 结果如下:

 原来的异常值消失了,但是可能会出现新的异常,但是我们就不再处理了,处理一次就可以了。

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

旋转跳跃我闭着眼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值