SAS笔记#通过TABULATE过程制作汇总报表

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

对于观测数庞大的数据集,通过汇总报表可以集中地反映数据的概要特征。


一、TABULATE过程的基本语法

proc tabulate data=数据集 <选项>;
	class 变量1	<变量2	变量3...>;
	var	变量4	<变量5 变量6... >;
	table	<<页表达式,> 行表达式,> 列表达式</选项 >;
run;

说明:

  1. class语句中的变量为分类变量,依据分类变量不同取值可以将数据集中的观测划分为不同的分组类别。
  2. var语句中的变量称为分析变量,这些变量就是进行分析计算的对象。
  3. table语句用来定义表格布局。

二、使用步骤

1.制作基本汇总报表

先来观察一下原先的数据集
在这里插入图片描述
1.1显示每一个洲的交易次数

代码如下(示例):

proc tabulate data=ex.sales_halfyear;
	title1 'Sales in North America';
	title2 'Trancations in Each State';
	class state;
	table state;	/* table只有一个表达式时,以这个表达式作为列表达式 ,表达式的每个取值作为一列*/
run;

结果如下:
在这里插入图片描述
1.2显示每一个洲的交易金额
代码如下(示例):

proc tabulate data=ex.sales_halfyear;
	title1 'Sales in North America';
	title2 'Trancations in Each State';
	class state;
	var amount;
	table state,amount;	/* table只有一个表达式时,以这个表达式作为列表达式 ,表达式的每个取值作为一列*/
run;

结果如下:
在这里插入图片描述
1.3汇总每种产品在每个洲的交易金额总和
代码如下(示例):

proc tabulate data=ex.sales_halfyear;
	title1 'Sales in North America';
	title2 'Total Amount Sold in Each State for Each Type';
	class state type;
	var amount;
	table type,state,amount;
run;

结果如下:
在这里插入图片描述
还可以通过星号(*)将两个表合并在一个表上,绘制成交叉组合表格
代码如下(示例):

proc tabulate data=ex.sales_halfyear;
	title1 'Sales in North America';
	title2 'Total Amount Sold in Each State for Each Type';
	class state type;
	var amount;
	table type*state,amount;
run;

结果如下:
在这里插入图片描述
注:此时的type*state代表行维度

分析:原数据集中的type变量只有Customerize和Simple,则以这两个type的值分别汇总了每个州的交易金额总额。

2.统计量与同时计算多种统计量

在上面的例子中,使用的都是系统默认的统计量,其中分类变量的默认统计量N,分析变量的默认统计量为SUM。除了频数的统计量和i去和统计量TABULATE还有其他统计量。

统计量作用
N频数统计量,非缺失值个数
NMISS缺失值个数
MEAN平均值
MAX最大值
SUM求和
VAR方差
PCTN观测在所有观测中所占的个数
COLPCTN观测数在本列所有观测中所占的百分比
POWPCTN观测数在本行中所有观测中所占的百分比
PCTSUM观测值总和在所有观测值总和中所占的百分比
COLPCTSUM观测值总和本列所有观测值总和中所占的百分比
ROWPCTSUM观测值总和在本行所有观测总和中所占的百分比

使用TABULATE过程制作汇总表格时,还可以同时显示多个统计量,还是使用之前的数据集,显示每种产品在每个洲的交易次数,平均销售金额,销售总额。
代码如下(示例):

proc tabulate data=ex.sales_halfyear;
	title1 'Sales Report in North America';
	class state type;
	var amount;
	table type*state,amount*n amount*mean amount;
run;

结果如下:
在这里插入图片描述

总结

以上就是今天要讲的内容,本文介绍了SAS中TABULATE的使用,通过TABULATE来对观测数庞大的数据集进行汇总。
提示: 本文章内容来自《深入解析SAS》第五章----数据汇总与展现,详细内容可自行了解阅读

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值