在进行数据分析的过程中,有时候拿到的数据并不完整,有很多确实数据。这就需要我们对这些缺失值进行处理。一般的处理办法包括删除缺失值较多的样本和变量、使用其他样本均值替代缺失值等方法。而利用回归模型进行缺失值插补的方法也是十分普遍的,本文将利用一个例子进行介绍。
1 读取数据。
library(foreign) #加载程序包
stu_data_na=read.spss(file="stu_data_na.sav",to.data.frame=TRUE)
head(stu_data_na) #查看数据前几行