数据加工的函数真的好多,今天就写最后一篇了,以后大家还是根据自己需求去找呗~
1)proc format创建自己的格式
有时候用数字代表实际的变量值,比如1代表男性,2代表女性,这种代码在打印的时候不好解读,可以用proc format使得打印出想要的值。
基本形式为:
① Value语句中的name是格式的名字,如果格式是位字符串设计,则必须以$开头,长度不能超过32个字节(包括$),不能以数字结尾,除了下划线不能包含其他任何特殊符号;
② 名字不能与已有的格式名冲突;
③ Range是分配给等号右边文本的变量值,文本可以达到32767个字节,有的过程只会打印前面8或16个字节;
④ 变量值是字符串时要加上引号;
⑤ range不止一个值要用逗号隔开,连续的range要用-;
⑥ 关键字low和high可以用来指代变量中最小和最大的非缺失值;
⑦ 可以用<来排除或指代某些范围,但"<"来表示不包括范围的结尾值;
⑧ other可以给任何没有列在value语句中的变量分配格式。
2)利用file语句和put语句定制报告
用file语句和put语句 ,基本形式为:
FILE‘file-specification’PRINT;
如input,put语句也有list,column,formatted方式,但因为SAS已经知道变量类型,因此不用符号$。且如果使用list,SAS会自动在两个变量之间加上空格;使用column或者formatted,SAS将会把变量放在任何你指定的地方。使用指示器@n指定移动到第n列,+n指定移动n列,/跳动到下一行,#n跳动到第n行。用@hold住当前行。
这个比较难理解,还是举个例子~
学生卖糖果,数据集为Candy.dat,记录学生名、所属班级、销售日期、卖的糖果类型、卖出的糖果数。