哈希表
官方解释:
散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。
给定表M,存在函数f(key),对任意给定的关键字值key,代入函数后若能得到包含该关键字的记录在表中的地址,则称表M为哈希(Hash)表,函数f(key)为哈希(Hash) 函数。
简而言之就是带有key的数组,可以通过搜索key来快速查找位置
因此,当我们面对需要查找集合里的元素就可以考虑运用哈希法。
哈希函数
哈希函数的作用是帮我们把非int的「键」或者「关键字」转化成int,可以用来做数组的下标。比如我们上面说的将学生的姓名作为「键」或者「关键字」,这是就需要哈希函数来完成,下图是哈希函数的转换示意图。
注意:
1、和数组一样,哈希值是从0开始,并且没有负值。
2、有可能不一样的key算出来的哈希值是一样的,所以就有哈希碰撞
哈希碰撞
不一样的key算出来的哈希值一样,在哈希表中放置于同样的位置上,就是哈希碰撞(也叫哈希冲突),解决办法有两个:1、链表法;2、线性探测法。
1、链表法
直接在该位置装下同样哈希值的元素,在原有的元素下挂同样的哈希值的元素,还有继续挂
(数据规模是dataSize, 哈希表的大小为tableSize)
其实链表法就是要选择适当的哈希表的大小,这样既不会因为数组空值而浪费大量内存,也不会因为链表太长而在查找上浪费太多时间
2、线性探测法
在位置同样的哈希值的下一位放置同样哈希值的元素,即原有的元素的哈希值的下一位放同样的哈希值的元素
常见的三种哈希结构
1、数组(可控的小范围)
2、set(范围比较大)
3、map(双值,有key又有value)