EDA(探索性数据分析)最常用的过程步之一就是PROC UNIVARIATE。
首先先看一个最简单的PROC UNIVARIATE程序:
PROC UNIVARIATE DATA=SASHELP.FISH; WHERE SPECIES='Bream'; VAR HEIGHT; RUN;
上述代码得到的结果有:矩、位置和可变形的基本测度、位置检验、分位数、极值观测。具体如下:
解读:首先看第一张表——矩,其中N=35代表该进入分析变量有35条观测,偏度约0.2稍微有点负偏态(右偏),变异系数12(不大