R模拟完全随机缺失
为了验证自己填补算法的好坏,一般采用完整数据集进行人为缺失,缺失机制为完全随机缺失(MCAR),可设置不同缺失率。
先下载simFrame包 install.packages("simFrame"),simFrame包可以直接对数据进行缺失处理。
具体操作如下:
1. 导入simFrame包
> library(simFrame)
2. 读取你的完整数据集(csv文件)
> data<-read.csv("D://statlog.csv",sep=",")# sep为逗号分隔符
> dataFrame<-as.data.frame(data)
或者批量处理数据:
path <- "C:\\Users\\Administrator\\Desktop\\test"
fileNames <- dir(path)#批量读入文件一般使用dir(...)
,通过<