SAS描述统计量

MEANS过程

  • MEAN过程默认输出的统计量有:观测总数、均值、标准差、最大值和最小值。如果要计算其他统计量或其中的某一些统计量,则可在PROC语句中指定统计量的关键字。
  • BY语句规定了分组变量,要求在BY分组内计算描述性统计量 。

  

proc means data=data.bank
   min p1 q1 mean median q3 p99 max ;
run;

 UNIVARIATE过程

  • UNIVARIATE过程也可以提供描述统计量的计算,另外还有统计频数、绘制图形和假设检验的功能。
  • 使用UNIVARIATE过程计算描述统计量与MEANS过程所用的语句和选项都基本类似,只是UNIVARIATE过程不需要指定统计量关键字,而是默认给出所有的基本统计量和一些关于位置检验的结果。
proc univariate data=data.bank;
run;

 FREQ过程

  • 描述分析,产生频数表和列联表,可以简单的描述数据
  • 统计推断产生各种统计量,分析变量之间的关系
  • TableS 用来定义频数表或交叉表,可以有多个tables语句。当频数表是命令为tables JOB1, 生成一维表;而命令为: tables JOB1*good_bad;变量之间中间用*隔开,表示生成二维交叉表
  • Tables后的选项为norow nocol nopercent:若只需要频数,不需要各行各列的百分比,可在tables后面加上这些参数
proc freq data=data.bank;
  table poutcome*y/norow nocol nopercent;
run;
  • 对连续数值变量做Freq时,系统会对每个数值进行频数统计,这个结果一般不是我们所需要的。我们一般会将连续变量转换为离散变量,这个可以通过Format程步来实现。
proc format;
  value age_cd
  17-<25='<25'
  25-<30='25-30'
  30-<45='30-45'
  45-<60='45-60'
  60-high='>=60';
run;
proc  freq data=data.bank;
   table y*age/norow nocol nopercent;
   format age age_cd.;
run;

 

转载于:https://www.cnblogs.com/karlpearson/p/6390108.html

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值