1.用proc univariate检验数据分布
例:
data class;
infile 'd:\data.xlsx'
input score @@;
proc univariate data=class;
var score;
title;
run;
2.用proc means 产生统计量
proc univariate会默认打印所有的统计量,而proc means可以打印需要的统计量
语句为:proc means staristic-keywords;
var语句:means会默认为所有的数值型变量产生统计量,如果不需要,那么用var语句中指定你需要的变量。
例:
data booklengths:
infile 'd:\data.xlsx\'
input numberofpages @@;
proc means data=booklengths N mean median clm alpha=.1;
title 'summary of picture book lengths';
run;
3.用proc freq检验分类数据
基本形式为:proc freq;
tables variable-combination/options;
例:
data bus;
infile 'd;\data/xlsx\'
input bustype $ ontimeorlate $ @@;
proc freq data=bus;
tables bustype*ontimeorlate/chisq;
title;
run;
4.用proc corr检测相关性
基本形式为proc corr;可以和var和with来指定变量:var variable list;with variable-list;
var语句中的变量出现在交叉表顶部,而with的变量出现在左侧。默认情况下计算的是pearson相关系数,可以增加选项要求非参数的相关系数。
5.使用proc reg做简单的回归分析
6.读取proc reg输出
7.使用proc ANOVA做单因素方差分析