描述统计,顾名思义就是用统计的方法来描述数据,直观、易于理解的角度描述数据,一般以常用的统计量(如:均值、方差、标准差)和图形来呈现。
1.常用的统计量
proc means计算,选用限定的统计量,这里的 MAXDEC = n 控制了统计量所保留的小数,output 为输出,out=输出的数据集,n(变量)=命名变量。
data class;
set sashelp.class;
run;
proc means data=class n mean maxdec=3;
title "Simple Descriptive Statistics";
var height;
output out=a n(height)=n mean(height)=mean;
run;
2.图形的描述
这里加入normal和plot得到正态性检验、茎叶图和箱线图,如果只有plot,输出结果与有normal,plot的结果一致,可能默认为正态分布。
proc univariate data=class normal plot;
title "More Descriptive Statistics";
var height ;
run;
此外,proc univeriate还会输出一些统计量及其检验,学生化t检验,符号秩检验(涉及到非参数统计的知识,与排序相关)这里不做详细的说明。