回答重点
Hash 碰撞是指在使用哈希算法时,不同的输入数据通过哈希函数计算后,得到了相同的哈希值(即散列值)。因为哈希值相同,所以这些键会被映射到哈希表的同一个位置,从而引发“碰撞”。
常见有以下几种方式解决哈希碰撞问题:
1)拉链法(链地址法):
将哈希表中每个槽的位置变成一个链表,当多个键的哈希值相同时,将它们存储在同一个链表中。
2)开放寻址法:
如果出现碰撞,寻找哈希表中的下一个可用位置。
3)再哈希法(双重哈希):
在出现碰撞时,使用第二个哈希函数计算新的索引位置,减少碰撞的概率。
扩展知识
拉链法(链地址法)
使用链表来处理冲突,每个哈希表的槽(bucket)不仅存储单个元素,而是存储指向链表头部的指针。所有具有相同哈希值的元素都会被放入到同一个链表中。
优点:
简单易实现,扩展性好。
在处理大量数据时,性能更为稳定。
缺点:
如果碰撞频繁,链表会变长,导致查询性能下降。
需要额外的内存来存储链表的指针。