HASH 与 随机数

本文探讨了哈希与多值哈希的概念,包括桶排序和垃圾邮件过滤器的应用。文章阐述了碰撞概率及其优化策略,如选择多值哈希以降低碰撞概率,并介绍了如何通过优化随机数生成器提高哈希函数的性能。此外,通过比较不同的随机数生成方法,如乘法和MD5,展示了如何评估和改进哈希函数的随机性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文主要介绍一下hash与多值hash,然后在讨论一下支撑hash的伪随机数生成器。不感兴趣者可以走了……


一:hash 与 多值hash:

野史

第一次见到hash,是在算法导论里看到的,其中的桶排序就是使用了此类思想,当然也有专门介绍hash的章节。感觉却是高明。后来在sqlseveral中也经常接触,毕竟作为join的一种优化方法经常都很靠谱。而多值hash则是在《数学之美》中接触到的,其中用作垃圾邮件过滤器。两个字:神奇。后来在一些分类统计中经常使用,感触更深。hash的本质就是用一个函数根据内容本身计算出内容的存储位置然后存储之,取的时候自然也就是看到内容立刻就能计算出(而不是找出)目标的位置。

碰撞

这个计算位置的函数先放一下,假设已经有了,而且内容无规律,我们选择了随机函数;先讨论碰撞问题。假设在一个100万的序列中已经有1万个

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值