*思路:首先构建一个含有缺失变量的数据集,然后进行变量缺失值的填充;
*使用sasuser数据库中的admit数据集,此数据集包含9个变量和21个观测,现用其中的height变量作为缺失值变量进行填补
使用proc freq过程查看变量height的频数构成;
data test;
set sasuser.admit;
run;
proc contents data=test;
run;
sasuser.admit数据集
proc freq data=test;
table height;
run;
height频数分布
*将height做成含有缺失值的变量,规则是将小于63的值设置为缺失,在SAS中数值型变量使用点来表示;
data test;
set test;
if height<63 then do height=.;
end;
run;
将height设置为缺失变量
*使用proc means 过程查看缺失数据集中变量height的缺失数目,中位数,平均数;
proc means data=test nmiss median mean;
var height;
run;
查看缺失值个数,中位数以及平均数,以