文章目录
概述
HashMap是Map接口的一个是实现类,用来存储一组key-value键值对
如何表示key-value键值对
class Node<K,V>{
K key;
V value;
}
我们自定义了一个Node类,只有两个属性,一个是key属性,表示键,一个value属性表示值。
如何存储key-value键值对
存储key-value键值对的方式有两种:
①使用链表:大小不限,插入和删除性能好,查找效率低
②使用数组:大小有限,插入和删除性能差,查找效率高。
一般来说,我们使用HashMap来存储数据,对于键值对的查找操作居多,所以我们一般使用数组来存储键值对
如何有效地根据key值查找value?
一种方式是通过遍历数组中的每一个元素,每遍历一个元素判断其key值是否是我们想要查找的,但是这种方式效率很低。我们使用数组存储key-value键值对的初衷就是希望查找效率高。
另一种方式,我们需要建立一种key和index
之间的映射关系,这样,我们每次查找一个key时,首先根据映射关系,计算出对应数组的下标,然后根据下标直接找到对应的key-value对象。
这里将key映射成index的方法称为 hash算法。
如何避免hash冲突?
我们使用hash算法计算出来的数组下标难免会有重复的,我们需要使用什么办法来避免hash冲突呢?
① 链地址法:将哈希值相同的元素构成一个单链表,并将单链表的头结点放在哈希表中的第i个单元中
② 再哈希法
③ 开放地址法
哈希算法
我们上面提到过为了方便我们快速的查找元素在数组中的位置,我们需要使用hash算法麻将key映射成index。
由于数组的长度是有限的,我们先将key映射成整数,再将这个整数映射成下标。
对于 key->int
这部分,使用的hash function(散列函数),对于int->index
这部分来说,我们使用数组的大小取模实现。
hash function
hash function即散列函数,又称散列算法,哈希函数,是一种从任何一种数据中创建小的数字的方法。
在java中,hash函数是一个native方法,它定义在Object类中,所有类都会继承。
HashMap中定义了自己定散列方法:
HashMap中的hash算法
HashMap(JDK1.8)定义了自己的Hash算法:
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
我们都知道int类型是32位的,**h=key.hashCode()^h>>>16其实是将key的hashCode的高16位与低16位进行异或操作。**使得该hashCode映射成数组下标时更均匀。
这样干有什么用呢?我们先来看一看HashMap中关于数组下标的计算:
n = table.length;
index = (n-1) & hash;
这里的n指的是2的幂次方数。table的长度都是2的幂,因此计算index仅与hash值的低n位有关。
例:table.length = 2^4 = 16,其32位表示为:0000 0000 0000 0000 0000 0000 0000 1111
由此可见,只有hash的低4位参与了运算。
为此,HashMap中,table的大小都是2的n次方,即使在构造函数中 指定了table的大小,HashMap也会将该值扩大为距离它最近的2的整数次幂的值。
HashMap的属性及构造器
// 序列号
private static final long serialVersionUID = 362498820763181265L;
// 底层数组默认容量
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
// 底层数组最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
// 默认的负载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 链表转为红黑树时的单链表元素的个数
static final int TREEIFY_THRESHOLD = 8;
// 红黑树转为链表的元素个数
static final int UNTREEIFY_THRESHOLD = 6;
// 红黑树最小容量
static final int MIN_TREEIFY_CAPACITY = 64;
// 底层存储keyy-value键值对的数组
transient Node<K,V>[] table;
// 记录元素个数
transient int size;
// 要调整大小的下一个大小值,即数组元素个数达到这个值是,就要进行扩容
int threshold;
// 加载因子
final float loadFactor;
// 没有指定时, 使用默认值
// 即默认初始大小16, 默认负载因子 0.75
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
// 指定初始大小, 但使用默认负载因子
// 注意这里其实是调用了另一个构造函数
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
// 指定初始大小和负载因子
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new Illegal