哈希表理论基础

什么是哈希表?

哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做哈希函数,也可以称为散列函数,存放记录的数组叫做散列表。

哈希函数

哈希表hashtable(key,value) 的做法其实很简单,通过hashCode把Key转化为数值,一般hashcode是通过特定编码方式,可以将其他数据格式转化为不同的数值,这样就把Key转化为一个具体的数字了。然后该数字通过一个固定的算法函数,将其转换成一个下标,最后将value存储在该下标的数组空间里。该算法即所谓的哈希函数。

而当使用哈希表进行查询的时候,就是再次使用哈希函数将key转换为对应的数组下标,并定位到该空间获取value,如此一来,就可以充分利用到数组的定位性能进行数据定位。

哈希碰撞

但是,如果两个不同Key值经过哈希函数的转化最后得到的数字相同怎么办?这其实就是哈撞希碰。该如何解决这个问题呢?一般哈希碰撞有两种解决方法,即拉链法线性探测法

拉链法

Java 标准库的 HashMap 基本上就是用 拉链法实现的。 拉链法 的实现比较简单,将链表和数组相结合。也就是说创建一个链表数组,数组中每一格就是一个链表。若遇到哈希冲突,则将冲突的值加到链表中即可。

线性探测法

线性探测 直接使用数组来存储数据。可以想象成一个停车问题。若当前车位已经有车,则你就继续往前开,直到找到下一个为空的车位。在数组中就是如果当前下标存有值就继续向前或向后探测,直到遇到一个未存有值的下标。

常用的哈希表

以C++为例,大体可分为三种,即

  • 数组
  • set (集合)
  • map(映射)

数组就不用多说,我们直接来看set(集合)和map(映射)

集合底层实现是否有序数值可否重复能否更改数值查询效率增删效率
set红黑树有序O(log n)O(log n)
multiset红黑树有序O(logn)O(logn)
unordered_set哈希表无序O(1)O(1)

映射底层实现是否有序数值可否重复能否更改数值查询效率增删效率
map红黑树key有序key不可重复key不可修改O(logn)O(logn)
multimap红黑树key有序key可重复key不可修改O(log n)O(log n)
unordered_map哈希表key无序key不可重复key不可修改O(1)O(1)

这里只介绍了C++中的哈希表,其他语言大多都有对应的容器。像Java中的HashSet、TreeSet、HashMap、TreeMap等,大家可查阅相关资料。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值