1. 什么是哈希表
(1) 哈希表是从一个集合A到另一个集合B的映射。
(2) 集合A中的元素称为键值,集合B中的元素称为hash值。
(3) 映射在数学上相当于一个函数,集合A中的元素如何映射到集合B,hash函数决定。
(4) 若两个不同的键值对应同一个hash值,这种情况为hash碰撞。
2. 哈希与查找
设集合A为查找对象,集合B为存储位置,利用hash函数将查找对象与存储位置对应起来,通过一次hash,便可以找到对象所在的位置。
问题:如何解决hash碰撞问题?
- 选好hash函数:使hash值均匀分布,尽量避免hash碰撞。
- 解决hash碰撞问题:
(1)链表存储;
(2)rehash:为了避免链表过长,查找效率低,引入了rehash。rehash的时机由装载因子决定,表示hash表的装满程度。
3. 一致哈希性
判断hash 算法好坏的四个定义:平衡型、单调性(分布式机器可扩展)、分散性、负载。