本次课主要总结以下语句的使用:
DATA
INPUT
DATALINES(CARDS)和DATALINES4
LENGTH
LABEL
LOSTCARD
INFORMAT/FORMAT
MISSING
OPTIONS
1、data
格式:DATA <数据集名> <选项>
常用选项:label=为数据集提供标记;DROP=列出不包括在数据集中的变量
缺省逻辑库为WORK,临时逻辑库,当关闭软件,这个逻辑库的数据集会消失
同一次会话过程中,可以有多个DATA语句创建多个数据集。最后建立的为当前数据集
如果分析工作不需要建立数据集,DATA语句中的数据集名可以用_NULL_
示例1:
DATA student;
INPUT num $ name $ sex $;
DATALINES;/*定义内置数据,功能与cards相同
060101 zhangsan f
060102 liling m
060201 liufeng f
DATA score;
INPUT num $ phy math engl;
DATALINES;
060101 89 90 77
060102 92 70 88
060201 80 84 75
PROC PRINT;/*这里有两个数据集,没有指出输出哪个数据集,则会输出最后一次建立的数据集
/* PROC PRINT DATA=student; */要指定具体数据集名称才会输出相应的数据集,输出student数据集
RUN;
示例2:空数据集,不会再硬盘建立数据集,只是为了输出a这个变量
data _null_;
a=sin(3.14159/4);
put a ; /*显示a的值*/
run;
示例3:
LIBNAME ep 'e:\saslx' ;/*把数据输出到本地就可以永久使用
DATA ep.students;
INPUT num $ name $ sex $ h w ;
DATALINES;
020801 ZHANGLING F 1.56 47.1
020802 ZHAOHUA M 1.72 61.5
030813 WANGQANG M 1.69 64.5
030824 LIULI F 1.58 53.6
030815 SHIDONG F 1.60 48.0
;
PROC PRINT;
RUN;
建立永久数据集以后,下次可以直接调用
LIBNAME ep 'e:\saslx' ;
PROC PRINT DATA=ep1.students;/*调用本地的数据集
2、input
(1)列表输入
用于描述输入的数据。从外部文件或紧跟的CRADS读入数据,赋给该语句列出的各个变量。
格式:INPUT <数据项描述>……
一般认为读入的数据是数值