一.介绍一下散列表
散列表又名哈希表,是根据键(Key)访问存储在内存中的值(Value)的数据结构。散列表是由数组演化而来的,利用了数组支持按照下标进行随机访问数据的特性。可以理解为Value存储在一个数组中,通过Key计算出对应Value在数组中的下标进行访问。
二.哈希函数hash()
1.将key映射为数组下标的函数叫做哈希函数。
2.哈希函数的基本要求
(1)哈希函数计算得到的哈希值(又叫散列值)必须大于等于0,因为要用作数组下标。
(2)如果key1=key2,则hash(key1)=hash(key2)。
(3)如果key1!=key2,则hash(key1)!=hash(key2)。
三.哈希冲突
1.哈希冲突:又叫哈希碰撞、散列冲突,是指不同的key经过hash()映射到数组同一个位置
2.哈希冲突是不可避免的。即使是著名的MD5、SHA等哈希算法也会出现不同key值经过hash()后的哈希值相同的情况。因此哈希函数的第3点要求是无法完全实现的。
四.哈希冲突解决方案——链表法
1.实现:在哈希表中,数组的每个存储位称为一个槽或桶。每个槽存一条链表,所有发生哈希冲突映射到该槽的元素,都添加到链表中。
2.链表转化:当发生哈希冲突元素过多,导致一个槽位的链表很长时,搜索效率会下降。此时可以将链表转化为红黑树结构。查询时间复杂夫由链表的O(n)下降到红黑树的O(logn)。此外,将链表转化为红黑树,还可以预防DDos攻击。