在SAS系统中,除了可以使用MEANS过程执行描述性统计分析外,也可用UNIVARIATE过程进行描述性统计分析。UNIVARIATE过程的基本功能如下:
描述性统计分析,涉及偏度、峰度、分位数的计算,频率表的绘制和变量极端值分析等。
常用统计图形的绘制,包括直方图、概率分布累积图和Q-Q图等。
数据的正态性检验。
在SAS系统中,UNIVARIATE单变量过程的基本格式为:
PROC UNIVARIATE [选项] ;
BY变量列表;
CDFPLOT变量列表 [选项];
CLASS 变量列表;
FREQ 变量;
HISTOGRAM 变量列表 [选项];
ID 变量;
OUTPUT [out=输出数据集名] [统计量关键字=变量名];
QQPLOT 变量列表 [选项];
VAR 变量列表;
WEIGHT 变量;
其中:
PROC语句用于指定使用UNIVARIATE过程进行描述性统计分析,同时,在该语句后常用的选项介绍如下:
DATA=数据集名:指定需要分析的数据集。
PLOT或PLOTS:绘制茎叶图、盒式图和正态概率图。
FREQ:生成频数分布表。
NORMAL:对输入变量进行正态性检验。
BY语句用于指定分组的变量,在组内对数据进行描述性分析。
CDFPLOT语句用于控制概率分布累积图的绘制。
CLASS语句的用法基本同BY语句,用于指定分组的变量。
FREQ语句用于指定代表观测频数