1、PROC MEANS分析
PROC MEANS DADA = <数据集名>[<统计量关键字列表>];
[VAR <分析变量列表>;]
[BY|CLASS<分组变量列表>;]
[OUTPUT OUT=<输出数据集名> <关键字>=<变量名>...;]
RUN;
- 统计关键字列表:指定要计算的统计量,省略此项,过程会自动计算观测值、均值、标准差、最大值、最小值5个统计量;
- 分析变量列表:指定所要分析的所有变量,多个变量之间用空格隔开;
- 分组变量列表:指定统计分组变量,多个变量之间用空格隔开;
- means过程中可以使用class和by两个语句进行分组统计,其区别为:
- 使用by时,必须按分组变量排序,使用class无此要求;
- 使用by时,统计结果每组一张表,使用class语句将所有统计结果放在一张表中
统计学生体检表中身高的观测数、均值、标准差、最大值、最小值
proc means data=sashelp.class;
var height;
run;
2、PROC UNIVARIATE分析
PROC UNIVARIATE DATA=<数据集名>[选项];
[VAR<分析变量列表>;]
[BY|CLASS <分组变量列表>;]
[OUTPUT OUT=<输出数据集名> <关键字>=<变量名>...;]
RUN;
UNIVARIATE过程,相比MEANS过程,能够进行更为全面的描述性统计分析;
计算学生体检数据表中体重的各种统计量
proc univariate data=SASHELP.class;
var weight;
run;
在SAS中,必须采用proc univariate过程中的normal命令来检验正态性
3、SGPLOT过程制图
3.1 条形图
proc sgplot [data=数据集];
var|hbar 分类变量名/[选项];
选项:
group=变量名 指定数据分组变量
groupdisplay=cluster|stack 分组柱形图的方式,默认为satck堆叠
response=响应变量名 指定要汇总的数值变量
stat=means|freq|sum 未指定响应变量时,默认统计量是freq;指定了响应变量时,默认sum
datalabel = 变量名 该变量的值显示为每个bar的标签值
Barwidth=n 指定条形的宽度,范围为0.1-1,默认值为0.8
绘制条形图坐标轴:
proc sgplot[data=数据集];
XAXIS|YAXIS [选项]; /*定义坐标轴*/
选项:
GRID 绘制坐标轴上每个刻度标记线;指定要汇总的数值变量
VALUES={value-list} 坐标轴上刻度标记的值
如:VALUES={0 10 20 30 40 50 60 70 80}或VALUES={0 to 80 by 10}
3.2 盒形图
proc sgplot[data=数据集];
VBOX|HBOX 连续变量名/[选项];
选项:
CATEGOPY=分类变量名 为变量的每一个值都分别绘值盒形图
3.3 直方图
proc sgplot[data=数据集];
Histogram 连续变量名/[选项];
选项:
NBINS=n 指定直条的个数
BINWIDTH=n 如果没有指定“NBINS=”选项,则由此指定直条的宽度
BINSTART=n 指定第一直条的中点
SCALE=尺度类型 指定垂直轴的尺度,包括PERCENT(默认值)、COUNT或PROPORTION
4、GPLOT制作点线图
绘制散点图和连线图
PROC GPLOT DATA=<数据集名>;
PLOT<纵轴变量>*<横轴变量>[=<分组变量>][/<选项1>];
[SYMBOL<N> <选项2>];
RUN;
选项1:用来设置图形的整体特性,例如坐标轴的值、颜色、外框颜色、填充色等
选项2:点或连线的相关参数
5、GCHART过程制图
GCHART可以绘制方块图、条形图、饼图、环形图等
PROC GCHART DATA=<数据集名>;
<图形关键字><变量名>/<选项列表>;
RUN;
图形关键字 | 图形类型 |
---|---|
block | 方块图 |
hbar | 水平条形图 |
hbar3d | 三维水平条形图 |
vbar | 垂直条形图 |
vbar3d | 三维垂直条形图 |
pie | 饼图 |
pie3d | 三维饼图 |
donut | 环形图 |
star | 星型图 |
<选项列表>
type=统计量关键字 常用的统计量关键字有Freq(频数)、mean(均值)、sum(总数)、percent(频数百分比),默认为频数;
group=变量 指定分组变量;
subgroup=变量 指定第二次分组的变量
midpoints=值列表 指定条形图每个矩形中点
levels=值 指定条形图中矩形的个数