统计描述与SAS过程

1、统计报表

TABULATE过程制表不是列出观测值,而是计算观测的分类统计量,绘制统计量的表格。对于数据汇总比较有用.
PROC TABULATE DATA=数据集名;
   CLASS 分类变量;
   VAR 分析变量;
   TABLE 页维说明,行维说明,列维说明/统计量选项;
RUN;
统计名包括:N,NMISS,MEAN,STD,MIN,MAX,RANGE,SUM,USS,CSS,STDERR,CV,T(检验均值为0的t统计量),PRT(t统计量的p值),VAR,SUMWGT(权数变量的和),PCTN(某类观测占总观测个数的百分比),PCTSUM(某类观测的总和占全部总和的百分比)。

2、图形描述 SAS/GRAPH模块

绘制散点图、折线图及曲线图、直方图、扇面图、三维曲面图、等高线图、地图等。
GPLOT过程,绘制散点图、折线图及曲线图
data t;                                                                                                                                 
input year x;                                                                                                                           
x1=log(x);                                                                                                                              
cards;                                                                                                                                  
1975 1.45                                                                                                                               
1980 0.82                                                                                                                               
1985 0.23                                                                                                                               
1990 0.14                                                                                                                               
;                                                                                                                                       
symbol c=gold i=join;                                                                                                                   
proc gplot;                                                                                                                             
plot x*year x1*year;                                                                                                                    
symbol c=red;                                                                                                                           
run;

x为垂直变量 *号右端为水平变量

2.2 GCHART过程绘制条形图、饼图、柱状图

垂直条形图VBAR水平条形图HBAR饼图PIE语句柱状图BLOCK语句
每种图形所代表的意义可以不同,主要通过选择TYPE=统计量类型,确定图形所代表的含义。
常见的统计量类型有:FREQ(频数),PCT(百分数),VFREQ(累计频数),SUM(总和)、MEAN(平均值)
data ran1;                                                                                                                              
do i=1 to 500;                                                                                                                          
x1=normal(0);                                                                                                                           
x2=2+normal(0);                                                                                                                         
y1=x1+x2;                                                                                                                               
y2=x1-x2;                                                                                                                               
output;                                                                                                                                 
end;                                                                                                                                    
symbol;                                                                                                                                 
proc gchart;                                                                                                                            
vbar x1 x2 y1 y2/midpoints=-8 to 8 by 0.5 raxis=120 space=0;                                                                            
run;



3、三维曲面图和等高线图
data dnorm2;    
a=2;            
a2=sqrt(a);     
r=0.5;          
det=a*(1-r*r);                                                                                                                          
do x=-3 to 3 by  0.3;    
  do y=-3*a2 to 3*a2 by 0.3*a2;  
        z=1/(2*3.1415926*det)*exp(-0.5/det*(a*x*x+y*y-2*r*a2*x*y)); 
                output;                                                     
        end;     
end;             
keep x y z;      
run;            
proc g3d data=dnorm2;  
plot x*y=z;  
run; 



用GCONTOUR过程可以绘制曲面对应的等高线图
proc gcontour data=dnorm2; 
plot x*y=z;    
run; 


添加标题和脚注

四、计量资料的统计量描述

MEANS过程、UNIVARIATE过程用来计算简单的数据汇总信息,分别计算对区间变量计算均值、标准差等数字特征。

1、MEANS过程

PROC MEANS[options][statistics-keywords]
    VAR variables;
    CLASS variables;
    BY variables;
   OUTPUT[OUT=SAS-data-set][output-statistics];
options可使用
①DATA=SAS dataset
②ALPHA=value 设置概率可信区间的置信水平,0~1之间取值。
[statistics-keywords],在MEANS过程中指出要统计哪些量,可选如下:
N MEAN    STD    MIN   MAX SUM   CV   STDERR  T PRT  SKEWNESS  KURTOSIS  CLM   LCLM  UCLM

2、UNIVARIATE过程

UNIVARIATE过程除可以完成类似MEANS过程的基本统计量的计算外,还可以计算以下统计量:
  1. 描述变量极端值的情况
  2. 计算分位数,如中位数
  3. 生成若干个描述变量的分布图
  4. 生成频率表
  5. 对数据进行正态性检验
  6. 对数据进行配对t检验和配对秩检验
PROC UNIVARIATE [options];
  VAR variables;
 BY variables;
 OUTPUT[out=SAS-data-set][output-statistics];
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值