sas分组计数_分享 | SAS里的HASH对象

Hash对象,也叫做Hash表,是一种提高数据查询效率的数据结构。Hash表使用散列的机制存储信息。在散列机制中,键的信息用于确定唯一的值,称为哈希码。然后将哈希码用作索引,在索引位置存储与键相关的数据。散列机制的优势是操作数据的执行时间保持不变,即使是对于比较大的数据量也是如此。

使用Hash对象编程是很多编程语言的一个特性,SAS也包含了这一特性。SAS内置了两种与Hash有关的对象:HASH和HITER。在一个data步里,我们可以创建一个Hash对象,这个Hash对象会留驻在内存里。当这个data步结束的时候,这个Hash对象会被自动删除。因此Hash对象的作用范围仅限于创建该Hash对象的data步。

下面我们以程序示例来说明Hash对象的使用。

假设有DM和LB两个数据集(数据集里的数据如下),我们需要对这两个数据集做一些数据处理。

DM数据集

SUBJID

AGE

SEX

S003

23

F

S004

39

F

S011

45

F

S017

30

M

LB数据集

SUBJID

LBTESTCD

LBORRES

S003

ALB

45.8

S003

ALP

40

S003

ALT

5

S004

ALB

50.5

S004

ALP

50

S004

ALT

10

S011

ALB

48.5

S011

ALP

59

S011

ALT

12

Question 1

我们先看第一个问题:

查找出现在DM数据集但是不出现在LB数据集的受试者,显然在这个例子里是受试者S017。考虑使用Hash对象来解决这个问题,SAS代码如下:

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值