将数据文件读入SAS ——DATA Step / PROC IMPORT
对数据长度的限制
读入以空格作为分隔符的原始数据
List Input读数据非常方便,但也有很多局限性:
(1)
不能跳过数据;
(2)
所有的缺失值必须以点代替
(3)
字符型数据必须是不包含空格的,且长度不能超过8;
(4)
不能直接读入日期型等特殊类型的数据。
程序举例:
INPUT Name $ Age Height;
有些原始数据的变量之间没有空格或其他分隔符,因此这样的文件不能以List形式对入SAS。但若不同变量值的都在每条记录的固定位置处,则可以按照Column 形式读入数据。Colunm读数据方法要求所有的数据均为字符型或者标准的数值型(数值中仅包括数字,小数点,正负号,或者是E,不包括逗号或日期型数据)。
相对于List方法,Column读数据方法有如下优点:
(1)
变量值之间无需用空格分开;
(2)
可以空格表示缺失值;
(3)
字符型数据中可包括空格;
(4)
可跳过数据。
程序举例:
INPUT Name $ 1-10 Age 11-13 Height 14-18;
使用格式命令读入非标准格式的数据
字符型数据: $informat w.
数值型数据:
informat w.d
日期型数据:
Datew.
(1)字符型:
$CHARw. :不删除前后空格,读入字符数据;
$HEXw. :将16进制的数据转化成字符数据;
$w.
:删除前面空格,读入字符数据;
(2)日期,时间或日期时间型数据
DATEw.
:以ddmmmyy或ddmmmyyyy形式读入日期;
DATETIMEw. :以ddmmmyy hh:mm:ss.ss 形式读入日期时间;
DDMMYYw.
:以ddmmyy或ddmmyyyy读入日期;
JULIANw.
:以yyddd或yyyyddd读入Julia日期;
MMDDYYw.
:以mmddyy或mmddyyyy形式读入日期;
TIMEw.
:以hh:mm:ss.ss形式读入时间;
(3)数值型数据
COMMAw.d
:读入数值型数据,将其中的逗号,$ 删除,并将括号转化为负号
HEXw.