第一次见到这个面试题,是在某个不方便透露姓名的Offer收割机大佬的文章:
这……我当时就麻了,我们都知道HashMap的数据结构是数组+链表+红黑树,这是要手撕红黑树的节奏吗?
后来,整理了一些面经,发现这道题在快手的面试出现还比较频繁,分析这道题应该在快手的面试题库。那既然频繁出,肯定不能是手撕红黑树——我觉得面试官也多半撕不出来,不撕红黑树,那这道题还有点救,慢慢往下看。
认识哈希表
HashMap其实是数据结构中的哈希表在Java里的实现。
哈希表本质
哈希表也叫散列表,我们先来看看哈希表的定义:
哈希表是根据关键码的值而直接进行访问的数据结构。
就像有人到公司找老三,前台小姐姐拿手一指,那个墙角的工位就是。
简单说来说,哈希表由两个要素构成:桶数组
和散列函数
。
- 桶数组:一排工位
- 散列函数:老三在墙角
桶数组
我们可能知道,有一类基础的数据结构线性表
,而线性表又分两种,数组
和链表
。
哈希表数据结构里,存储元素的数据结构就是数组,数组里的每个单元都可以想象成一个桶
(Bucket)。
假如给若干个程序员分配工位:蛋蛋
、熊大
、牛儿
、张三
,我们观察到,这些名字比较有特色,最后一个字都是数字,我们可以把它提取出来作为关键码
,这些一来,就可以把他们分配到对应编号的工位,没分配到的工位就让它先空着。
那么在这种情况下,我们查找/插入/删除的时间复杂度是多少呢?很明显,都是O(1)
。
但咱们也不是葫芦娃,名字不能都叫一二三四五六七之类的,假如来的新人叫南宫大牛
,那我们怎么分配他呢?
这就引入了我们的第二个关键要素——散列函数
。
散列函数
我们需要在元素和桶数组
对应位置建立一种映射映射关系,这种映射关系就是散列函数
,也可以叫哈希函数。
例如,我们一堆无规律的名字诸葛钢铁
、刘华强
、王司徒
、张全蛋
……我们就需要通过散列函数,算出这些名字应该分配到哪一号工位。
散列函数构造
散列函数也叫哈希函数
,假如我们数据元素的key
是整数或者可以转换为一个整数,可以通过这些常见方法来获取映射地址。
- 直接定址法
直接根据key
来映射到对应的数组位置,例如1232放到下标1232的位置。
- 数字分析法
取key
的某些数字(例如十位和百位)作为映射的位置
- 平方取中法
取key
平方的中间几位作为映射的位置
- 折叠法
将key
分割成位数相同的几段,然后把它们的叠加和作为映射的位置
- 除留余数法
H(key)=key%p(p<=N),关键字除以一个不大于哈希表长度的正整数p,所得余数为哈希地址,这是应用最广泛的散列函数构造方法。
在Java里,Object类里提供了一个默认的hashCode()方法,它返回的是一个32位int形整数,其实也就是对象在内存里的存储地址。
但是,这个整数肯定是要经过处理的,上面几种方法里直接定址法
可以排除,因为我们不可能建那么大的桶数组。
而且我们最后计算出来的散列地址,尽可能要在桶数组长度范围之内,所以我们选择除留取余法
。
哈希冲突
理想的情况,是每个数据元素经过哈希函数的计算,落在它独属的桶数组的位置。
但是现实通常不如人意,我们的空间是有限的,设计再好的哈希函数也不能完全避免哈希冲突。所谓的哈希冲突,就是不同的key经过哈希函数计算,落到了同一个下标。
既然有了冲突,就得想办法解决冲突,常见的解决哈希冲突的办法有:
链地址法
也叫拉链法,看起来,像在桶数组上再拉一个链表出来,把发生哈希冲突的元素放到一个链表里,查找的时候,从前往后遍历链表,找到对应的key
就行了。
开放地址法
开放地址法,简单来说就是给冲突的元素再在桶数组里找到一个空闲的位置。
找到空闲位置的方法有很多种:
- 线行探查法: 从冲突的位置开始,依次判断下一个位置是否空闲,直至找到空闲位置
- 平方探查法: 从冲突的位置x开始,第一次增加
1^2
个位置,第二次增加2^2
…,直至找到空闲的位置 - 双散列函数探查法
……
再哈希法
构造多个哈希函数,发生冲突时,更换哈希函数,直至找到空闲位置。
建立公共溢出区
建立公共溢出区,把发生冲突的数据元素存储到公共溢出区。
很明显,接下来我们解决冲突,会使用链地址法。
好了,哈希表的介绍就到这,相信你已经对哈希表的本质有了深刻的理解,接下来,进入coding时间。
HashMap实现
我们实现的简单的HashMap命名为ThirdHashMap
,先确定整体的设计:
- 散列函数:hashCode()+除留余数法
- 冲突解决:链地址法
整体结构如下:
内部节点类
我们需要定义一个节点来作为具体数据的载体,它不仅要承载键值对,同样还得作为单链表的节点:
/\*\*
\* 节点类
\*
\* @param <K>
\* @param <V>
\*/
class Node<K, V> {
//键值对
private K key;
private V value;
//链表,后继
private Node<K, V> next;
public Node(K key, V value) {
this.key = key;
this.value = value;
}
public Node(K key, V value, Node<K, V> next) {
this.key = key;
this.value = value;
this.next = next;
}
}
成员变量
主要有四个成员变量,其中桶数组作为装载数据元素的结构:
//默认容量
final int DEFAULT_CAPACITY = 16;
//负载因子
final float LOAD_FACTOR = 0.75f;
//HashMap的大小
private int size;
//桶数组
Node<K, V>[] buckets;
构造方法
构造方法有两个,无参构造方法,桶数组默认容量,有参指定桶数组容量。
/\*\*
\* 无参构造器,设置桶数组默认容量
\*/
public ThirdHashMap() {
buckets = new Node[DEFAULT_CAPACITY];
size = 0;
}
/\*\*
\* 有参构造器,指定桶数组容量
\*
\* @param capacity
\*/
public ThirdHashMap(int capacity) {
buckets = new Node[capacity];
size = 0;
}
散列函数
散列函数,就是我们前面说的hashCode()和数组长度取余。
/\*\*
\* 哈希函数,获取地址
\*
\* @param key
\* @return
\*/
private int getIndex(K key, int length) {
//获取hash code
int hashCode = key.hashCode();
//和桶数组长度取余
int index = hashCode % length;
return Math.abs(index);
}
put方法
我用了一个putval方法来完成实际的逻辑,这是因为扩容也会用到这个方法。
大概的逻辑:
- 获取元素插入位置
- 当前位置为空,直接插入
- 位置不为空,发生冲突,遍历链表
- 如果元素key和节点相同,覆盖,否则新建节点插入链表头部
/\*\*
\* put方法
\*
\* @param key
\* @param value
\* @return
\*/
public void put(K key, V value) {
//判断是否需要进行扩容
if (size >= buckets.length \* LOAD_FACTOR) resize();
putVal(key, value, buckets);
}
/\*\*
### 给大家的福利
**零基础入门**
对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。
![](https://img-blog.csdnimg.cn/img_convert/95608e9062782d28f4f04f821405d99a.png)
同时每个成长路线对应的板块都有配套的视频提供:
![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/a91b9e8100834e9291cfcf1695d8cd42.png#pic_center)
因篇幅有限,仅展示部分资料
网络安全面试题
![](https://img-blog.csdnimg.cn/img_convert/80674985176a4889f7bb130756893764.png)
绿盟护网行动
![](https://img-blog.csdnimg.cn/img_convert/9f3395407120bb0e1b5bf17bb6b6c743.png)
还有大家最喜欢的黑客技术
![](https://img-blog.csdnimg.cn/img_convert/5912337446dee53639406fead3d3f03c.jpeg)
**网络安全源码合集+工具包**
![](https://img-blog.csdnimg.cn/img_convert/5072ce807750c7ec721c2501c29cb7d5.png)
![](https://img-blog.csdnimg.cn/img_convert/4a5f4281817dc4613353c120c9543810.png)
**所有资料共282G**,朋友们如果有需要全套《网络安全入门+黑客进阶学习资源包》,可以扫描下方二维码领取(如遇扫码问题,可以在评论区留言领取哦)~
**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**
**[需要这份系统化资料的朋友,可以点击这里获取](https://bbs.csdn.net/topics/618540462)**
**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**