graphpad7.04多组比较p值_R语言缺失值处理(MICE/Amelia/missForest/Hmisc/mi)

这是一篇对R语言中处理缺失值的整理,主要思路搬运自Medium上面一篇Harshitha Mekala写的文章Dealing with Missing Data using R,是我目前搜到的最全的关于missing value处理package的整理,足足五个包。我自己读的时候做了一些其他资料的查阅作为补充。我用了一个上课的时候老师给的完整的dataset,其中的missing value是随机生成的,写到哪部分的时候我会同时po一些代码和截屏。分成三个部分:

一、check missing values in your dataset

二、缺失值处理的四种思路

三、五个package在R中的实现


一、了解缺失值

1)计数一下有多少缺失:sum(is.na(data frame$column name)

2)MICE包中的 md.pattern(df)

bbae437b95babb1d9ca0bd2e4759ed91.png

3)visualisation:VIM包/UpsetR

library(VIM)
mice_plot <- aggr(cm, col=c('navyblue','yellow'),
    numbers=TRUE, sortVars=TRUE,
    labels=names(cm), cex.axis=.7,
    gap=5, ylab=c("Missing data","Pattern"),)

3e6b4b6d1b21dbe7f4b11f92f7c44797.png
VIM
library(UpSetR)
gg_miss_upset(cm)

b54a8abac68b884337caa1a8709f4fa8.png
UpsetR
missmap(iris.mis)

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值