哈希算法用素数（质数）求余的初步思考

最新推荐文章于 2023-04-07 21:19:08 发布

zieghart233

最新推荐文章于 2023-04-07 21:19:08 发布

阅读量1.2k

点赞数

文章标签：哈希表算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zieghart233/article/details/107181740

版权

例如，我们拿7和8比较

7和8的差别在于8有两个因数，2和4，简单起见，我们来讨论取模时，因数4的加入改变了什么

也就是讨论key%7 与 key%8的区别在哪。

假设key是由多字段乘权值得到的。

比如一个人的key = 1*年龄 + 4*身高。

我们假定年龄、身高都随机分布在1-100，那么我们可以知道，key可能的值有：

1,2,3,4,5,6....

我们再列出4的倍数

4,8,12,16,20,24,18,32......

我们可以发现，由于其因数4的存在，导致身高产生的那部分key%8（即4*身高%8），得到的数字不是从0~7均匀分布的（换句话说，4帮助身高key抽到更多4、8的倍数），结果总是在4与0之间跳动，进而导致了分布的不均匀。

因此若改用素数，4*身高%7，则能更好地使数据分布均匀。

PS：以上只是初步的思考，可能有不严谨之处。

参考

https://segmentfault.com/q/1010000000686035

https://www.cnblogs.com/xinzhao/p/4607235.html

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
哈希算法用素数（质数）求余的初步思考

例如，拿7和8比较7和8的差别在于8有两个因数，2和4，我们来讨论取模时，2和4的加入改变了什么假设key是由一个对象的多个字段分别乘某个数得到的。比如一个人的key = 2*年龄 + 4*身高。//例如年龄随机分布在1-100，身高随机分布在100-200。我们再列出2和4的倍数2,4,6,8,10,12,14,16,17......4,8,12,16,20,24,18,32......其中黑体为8的倍数，那么显而易见，合数8由于其因数的存在，导致key出现在第零下标的元素概率
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。