@[TOC] (目录)
第一章初识SAS
数据集的命名
数据导入
建立永久数据集
用菜单新建文件夹,并与电脑上已有文件夹关联
用libname语句指定文件夹名,并与电脑上已有文件夹关联
用data语句直接指定电脑上已存在的文件夹路径及sas数据集名
第二章SAS数据集建立的高级议题
sas变量的输入格式
数值型变量的输入格式:w.d(6.3:总位数是6,包括3位小数
sas先根据设定的总位数来读取数据,然后继续考小数位数的设定
sas读整数,没有小数点就自动把自己降为小数
== proc print输出数据集==把读取的数据显示到输出窗口
字符型变量的输入格式:$ w.
sas默认对字符只读取8位,如果变量宽度超过8字节,最好加上宽度值,以保证sas能全部读取
日期型变量的输入格式
常用的分隔符 - / .等sas都可以识别,但是分隔符也占宽度
如果年月日之间没有任何分隔符,此时sas要求输入的月和日都是2位(130508)(2013-5-8)
== 日期型变量的宽度最大不能超过32==
两个特殊输入符 :和&
sas默认以空格作为变量分隔,但是一旦对变量指定了宽度,sas就不在以默认的空格作为变量区分标志,而是按指定的宽度识别
== 在变量和输入格式之间加冒号:==告诉sas如果要读取下一个变量,需要满足小面任一条件:要么遇到空格,要么变量的宽度读完了
当同一变量的不同数据有不同宽度时,可以指定数据中最大或更大的一个宽度值,然后结合冒号读取
== 变量包含空格==在变量后多加一个&符号
因为每个变量本身有空格,所以变量之间就需要2个或2个以上的空格隔开,这样sas就会把2个及以上的空格作为变量分隔符
sas变量的输出格式
== 指定输入格式会改变变量的值,而指定输出格式不会改变变量的值,只是改变显示的样子==
input
format 变量1 格式1 变量2 格式2
数值型变量的输出格式
w.d
commaw.d:将数值的整数部分自右向左每三位用逗号隔开== w包含逗号和小数点在内==
percentw.d:将数据显示为百分位形式,自动将变量值乘以100,并加上%== 指定w时要预留3个字节的位置显示%==
字符型变量的输出格式
对于字符型变量来说,只要把正确读取进来,sas就会原模原样的把它输出出去
日期型变量的输出格式
自定义输入和输出格式
== proc format==
用informat和format自定义格式
用picture照个输出模板
== low-high的范围就是从最低值到最高值==
如何产生新变量
利用表达式或函数直接产生新变量
== 变量名=表达式或函数==
新变量一定要写在input和cards之间
利用if-then语句产生新变量
== if 表达式 then 新变量= ;
else 新变量= ; ==
利用retain语句和累加语句产生新变量
== retain 变量 <初始值>;==
== 变量+表达式;==
利用do循环语句产生新变量
==do 变量=初始值 to 最终值 <by 增加量>;
sas语句;
output;
end; ==
指定新变量的类型与长度
== length 变量1 <$> 长度1== length与一定要在新变量产生之前就设定好,否则是不起作用的。
字符变量的长度由第一个遇到的值的长度决定,而且字符变量一旦产生,它的长度就无法改变
2.5@符合在输入方式中的应用
== @@是强制sas往右读取数据==
@也是强制sas往右读取数据,不过它只在一定条件下才起作用,只有data不=步中有两个input语句的时候,才对第二个input语句才起作用,如果只有一个input语句,@就不起作用
2.6sas函数应用技巧
与数值计算有关的函数
与字符有关的函数
1.计算变量的长度
length
lengthn
== 如果要对一个变量的所有值进行同样的操作,而这个变量中的值长度不同,那就需要先判断变量长度,然后对不同长度设置不同的添加==
2.提取变量中的字符
substrn:指定一个变量,对该变量从起始位置开始,提取指定长度的字符
3.查找变量中的字符
find
findc:根据指定的起始位置,查找相应的内容,如果找到就返回找到的位置,找不到就返回0
anyalpha:查找变量中任意的字母,并返回第一个字母的位置
anydigit:查找变量中任意的数字,并返回第一个数字的位置
anyalnum:查找变量中任意的字母或数字,并返回第一个字母或数字的位置
4.替换变量中的字符
tranwrd(变量,查找值,替换值):从变量中找到“查找值”,并用“替换值”替换掉。
tranwrd一次只能替换一个字符串
5.去除变量中的字符
compress(变量<,欲去除的字符><,“修饰符”>):从变量中去掉“欲去除的字符”
== 修饰符== a去掉变量中所有的字母
b去掉所有的数字
s去掉所有的空格
i忽略大小写
k保留“欲去除的字符”,去掉其他的字符
6.变量的合并
cats:将几个变量合并为一个变量,删除前后空格
catx(“分隔符”,变量1,变量2…):将几个变量合并为一个变量,中间用分隔符隔开
==||==常规的连接符连接变量
7.清点变量中某字符的个数
count(变量,欲清点的字符<,“i”>):从变量中找到欲清点的字符,返回字符个数,如果没有找到返回0
8.查找变量中的缺失值
missing(变量):判断变量是否为缺失值,是则返回1,不是则返回0
missing对数值型变量和字符型变量都是通用的
missing函数一次只能查找一个变量的缺失值,但不意味着多个变量的查找需要写多个函数
与日期和时间有关的函数
1.日期的合并与差值
mdy:将年、月、日合并为一个日期格式的变量或值有人
yrdif(开始日期,结束日期,“计算依据”):计算两个日期之间以年为单位的差值
datdif(开始日期,结束日期,“计算依据”):计算两个日期之间以天为单位的依据
计算依据指定计算差值的依据,通常指定’actual",也就是按照当年的实际天数计算
2.日期的提取