稠密(dense)并且唯一(unique)的随机(random)数生成

本文是针对Jim Gray Sigmod94年的论文《Quickly GeneratingBillion-Record Synthetic Databases》第五章节的翻译和一点见解。主要介绍稠密(dense)并且唯一(unique)的随机(random)数生成算法。
摘要由CSDN通过智能技术生成

本文是针对Jim Gray Sigmod94年的论文《Quickly GeneratingBillion-Record Synthetic Databases》第五章节的翻译和一点见解。其中黑色字体为论文的翻译,黄色字体为我的一点理解。

在生成虚拟数据时经常需要具有下面这些特性的数字序列:

稠密的(dense):在数字序列中,[0, n]中的所有数字都必须出现;

唯一的(unique):在数字序列中,每个数字只能出现一次;

随机的(random):数据序列中的数字应该是随机出现的(可以是伪随机的)。

有了这些特性就可以让数据集上的选择操作和连接操作返回集可预测,例如每个用户应该有且仅有一个账户。已经有一些方法可以生成满足上述要求的dense-unique-random数字序列。Wisconsin Benchmark(威斯康星测试基准)最原始的生成器使用一个长度为N、初始值为0的bitmap,然后使用系统随机数不断去挑选下一个未使用的数字(比如生成一个随机数5,那么先判断bitmap[5]是否为1。如果不为1就返回5,并且设

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值