一个完整的数据步和过程步
数据步主要是用来处理数据,将“外数据“处理成sas能处理的”内数据“。
过程步主要应用于数据的分析展现。
data语句
格式:data<数据集名><选项>
常用选项:label=为数据集提供标记,drop=列出不包括在数据集中的变量
缺省逻辑库为work
同一个会话过程中,我们可以有很多个data语句,最后建立的为当前数据集。
如果分析工作不需要建立数据集,data语句中的数据集名可以用_NULL
data student;
input num $ name $ sex $;
datalines;
060101 zhangsan f
060102 liling m
060201 liufeng f
data score;
input num $ phy math engl;
datalines;
060101 89 90 77
060102 92 70 88
060201 80 84 71
proc print;
run;
input语句
用于描述输入的数据。从外部文件或紧跟的cards读入数据,赋予该语句列出的各个变量
格式:input <数据项描述>...
一般认为读入的数据是数值型的,除非:1变量名后有$号;2使用字符的输入格式表示;3变量先被定义成字符型
数据中的缺项值用“.”表示。如果读入数据与数据类型不匹配,则按无效数据置为缺项值。
input语句:数据项描述
方法一:列表或自由格式
方法二:列
方法三:格式化