哈希表的大小为何最好是素数

最新推荐文章于 2024-07-04 13:32:36 发布

圣斗士Morty

最新推荐文章于 2024-07-04 13:32:36 发布

阅读量1.9k

点赞数 6

分类专栏：数据结构与算法文章标签：取模哈希函数

本文链接：https://blog.csdn.net/u014745069/article/details/106596964

版权

25 篇文章 4 订阅

订阅专栏

引言

为什么散列函数采用取模运算？又为什么取模运算的被取模数最好是素数？素数是如何在取模运算中很好的规避冲突的？

这些问题可能困扰诸多程序员很久了。我们总是说素数可以更好的避免冲突，但总是对各种长篇大论的分析望而却步。

这篇文章是我在学习散列时针对素数在哈希函数中的如何成功避免大量冲突的原因总结。

尽可能言简意赅地描述为什么素数那么香。

素数能够在取模运算中避免冲突并不是一个数学定律，而且能够避免冲突也不是绝对的。

从规律上来看，如果待存储的数列间隔恰好是是被取模数的因子大小，那么合数要比素数更容易呈现周期性的取模重复。

这仅仅是一个规律，目前数学家也无法对这一规律进行严格定义，毕竟这个规律也并不是绝对的。

我们通过一个简单的例子来印证一下上面的这个规律：

从规律上来看，如果待存储的数列间隔恰好是是被取模数的因子大小，那么合数要比素数更容易呈现周期性的取模重复。

这个规律不是绝对的。下面选取了一个合数和一个素数，待存储的数列间隔为 2 或 3，请仔细观察规律：