问题起源:在真正的数据分析开始之前,需要确定如何从原始数据集中提取有效信息,而通常我们拿到的数据中,并非所有点位/变量都包含信息,那么,快速删除空白列,而保留下有信息的列,就会大大降低工作量,避免投入不必要的时间。
案例:data_08_1中存储的是手术相关信息,共包含2479个变量,总观测有19262条,有很多变量是整列都为空的,为从中找到合适的信息用于分析,拟删除空白列,留下有数据的列,来考虑接下来的分析内容
解决思路1:计数空白行,如果空白行数等于总行数,说明整列为空,需删除
解决方案1:
data temp; set data_08_1; array arr1{*} _numeric_; array arr2{*} _character_; do i=1 to dim(arr1); if missing(arr1(i))=1 then do; var=vname(arr1(i)); out