1,变量名命名规范:以字母或者下划线开始,可包含字母、下划线、数字,且不超过32个字符;
2,INFILE用于读取外部数据文件,一般于FILENAME(和LIBNAME用户一致,但路径要精确到文件名(、、.TXT/DAT等))连用。
3,INPUT语句用于定义字段变量,可用于读去外部文件(INFILE)、CARDS、DATALINES。
4,变量类型转换规则:①赋值:以赋值目标的变量类型而定自动转化;②做运算→数值型;③做字符连接→字符型;④经过了字符处理函数→字符型;
5,字符和数值型变量在数据集中的显示:①字符型→右对齐→缺失为空格;②数值性→左对齐→缺失为“.”;
6,在DATA步中一般情况下出现的字符都会默认为一个变量,若想写字符型常量则要用“”、‘’括起来。(若字符常量本身还有“”则用‘’括起来,相反则用“”括起来。)
7,日期型常量包括:日期(DATE)、时间(TIME)、日期时间(DATETIME)3种。这三个类型的常量必须用引号括起来并且后面加常量对应的字母D、T、DT,表示日期、时间、日期时间。
8,注意:十六进制数常量必须用单引号括起来,后面加字符X。
9,筛选语句IF和WHERE,WHERE是在编译阶段执行,即程序执行之前就先筛选,大大提高程序效率。IF语句在执行阶段执行,可用于新建变量的筛选。(一般情况下能用WHERE则用WHERE,缺点是:WHERE语句对变量类型的兼容性较低,严格控制“=”两边的数据类型相同,若多个WHERE语句出现只认最后一个WHERE语句),验证程序如下:
DATA A; INPUT ID X $; CARDS; 1 R 2 T 4 O 5 P ; RUN; PROC PRINT DATA=A; WHERE ID=1; WHERE X="P"; VAR ID X; RUN;
输出结果为:
SAS 系统 |
Obs | ID | X |
---|---|---|
4 | 5 | P |
DATA A;
INPUT ID X $ @@;
CARDS;
1 R 2 T
4 O 5 P
;
RUN;
DATA A;
INPUT ID X $ @@;
CARDS;
1 R
2 T
4 O
5 P
;
RUN;
以上两段代码输出的结果一样都是四条观测;
obs:表示需要处理的最后一行observation,如果指定其为max,就表示处理到最后一条observation
firstobs:表示需要从第几行observation开始处理,默认是1observation
msglevel:默认值是N,仅打印notes,warnings和error信息,如果设为I,则除了打印N选项的信息,同时打印附属信息,包括索引的使用,合并处理,排序等附加信息
errors:指定最多有多少错误可以在log中显示(也可以写成error=num,编译时按errors处理)
macrogen:将宏扩展的结果显示在log里
compress:是否采用压缩格式存储数据集
missing:指定用于替换missing value的字符,默认是(.)
ps(pagesize):输出时每页行数
ls(linesize):输出时每行字数
center/nocenter:指定输出是否中间对齐
date/nodate:指定输出是否包含日期
replace/noreplace:如果dataset已经存在,指定是否覆盖
print/noprint:指定是否在output窗口输出
date:输出页码显示日期 nodate:输出页码不显示日期
center:输出页居中 nocenter:输出页不居中
number:有页码 nonumber:无页码
mprint 打印宏的每一次执行过程在日志中 nomprint 不打印、、