理解表以及学会创建表之后,接下来要对单个表进行管理:主要使用:
1.select
2.from
3.where
4.group by
5.order by
6.having
其中select 以及from是必须的。个人理解就是:通过select语句选择变量 变量来自from指定的dataset,order by指定选出来的变量按照谁来排序,group by 按照谁来分组,having是对选出来的变量进行选择。
所以第一步你要确定你想要的变量有哪些,在那些表,然后使用where选择满足给定条件的观测出来。再按照你想要的排序或者group。如:
proc sql;*选择全部变量;
select *
from sashelp.class;
quit;
proc sql;*选择特定变量;
select sex, age heigth
from sashelp.class;
quit;
只选择height大于13的,并且按照height来进行排序;
proc sql;
select sex, age,height
from sashelp.class
where height >63
order by height;
quit;
额外的操作:变量去重,即唯一值;
proc sql;
select distinct age
from sashelp.class
quit;
以上的可以进行适当拓展:
order by 可以根据多个变量进行排序,同时可以选择排序的标准,有升aec,降desc,同理也可以根据多个变量进行group by。
where 后面的条件表达式,可以多样化,和data setp过程相同,例如:> ,<,=,not, and,or ,in any,all 等。
你以为proc sql 内容就完了?就好比如 你细细个学习1,2,3,4,5个阵其实,你只不过系学到1 2 3 4 5 6jie,当数字结合运算符号时,那就是大学的高数级别了。
接下来,会讲聚合函数,以及子查询。