目录
1.哈希表
哈希表又叫散列表(hash table),是根据关键码的值而直接进行访问的数据结构
哈希表中关键码就是数组的索引下标,然后通过下标直接访问数组中的元素
一般哈希表都是用来快速判断一个元素是否出现集合里。
2.哈希函数hash function
数据规模是dataSize, 哈希表的大小为tableSize
3.哈希碰撞
哈希碰撞解决方法
【方法1:拉链法】
发生冲突的元素都被存储在链表中。 这样我们就可以通过索引找到小李和小王了
其实拉链法就是要选择适当的哈希表的大小,这样既不会因为数组空值而浪费大量内存,也不会因为链表太长而在查找上浪费太多时间。
【方法2:线性探测法】
使用线性探测法,一定要保证tableSize大于dataSize。 我们需要依靠哈希表中的空位来解决碰撞问题。
例如冲突的位置,放了小李,那么就向下找一个空位放置小王的信息。所以要求tableSize一定要大于dataSize ,要不然哈希表上就没有空置的位置来存放 冲突的数据了。
4.常见的三种哈希结构
- 数组
- 集合(set)
- 映射(map)
当我们要使用集合来解决哈希问题的时候,优先使用unordered_set,因为它的查询和增删效率是最优的,如果需要集合是有序的,那么就用set,如果要求不仅有序还要有重复数据的话,那么就用multiset。
那么再来看一下map ,在map 是一个key value 的数据结构,map中,对key是有限制,对value没有限制的,因为key的存储方式使用红黑树实现的。
unordered_set
.insert(x):插入元素
.erase():删除元素
.count():记录元素个数
.find(x):查找元素,有的话返回指向该元素的迭代器,没有的话返回尾后迭代器
.clear():清楚所有元素
.size():返回哈希大小
注:调用前引用头文件#include<unordered_set>
5.总结
当我们遇到了要快速判断一个元素是否出现集合里的时候,就要考虑哈希法。
但是哈希法也是牺牲了空间换取了时间,因为我们要使用额外的数组,set或者是map来存放数据,才能实现快速的查找。