1. 剔除含有缺失值的案例(行)
algae[!complete.case(algae),] %找出algae数据集中具有缺失值的全部案例
剔除分两种:一种是剔除具有缺失值的全部案例;另一种是剔除缺失值较多的案例。
(1) 删除algae数据集中具有缺失值的全部案例:algae <- na.omit(algae)
(2) 剔除algae数据集中缺失值较多的案例
Step1:manyNAs<- manyNAs(algae,0.2)
%给出algae数据集缺失值较多案例所在的行数,其中0.2表示一个案例中缺失的属性占总属性的20%,为默认值,用户可根据自己的需求进行设置。
Step2:algae1 <- algae[-manyNAs,]