1.查找变量中缺失值得个数
sum(is.na(sleep$Dream))
2.查找变量中缺失值个数占总个数的比例
mean(is.na(sleep$Dream))
3.查找样本中含缺失值的样本所占样本比例
mean(!complete.cases(sleep))
4.用列表显示缺失值
代码
> library(mice)
> data(sleep,package="VIM")
> md.pattern(sleep)
说明
第一行为没有缺失值的记录,第一列是显示出记录数,最后一列是显示出缺失的记录数,最后一行是记录每个变量缺失值总和
5.图形探索缺失数据
代码
library("VIM")
> aggr(sleep,prop=F,numbers = T)
说明
左图可以看出每个变量中含缺失值得个数,右图可以看出变量组合的缺失值个数
6.缺失值需要引进的包
用权重进行均值的计算并填充缺失值
> attach