HashMap容器(jdk1.8)
底层采用数组+链表+红黑树(哈希表)
key,value允许储存null
线程不安全
默认容量16(初始化容量会强制转成2的幂次方)
默认负载因子 0.75
查询,增删的效率都高
HashMap变量
//允许最大容量2的30次幂
static final int MAXIMUM_CAPACITY = 1 << 30;
//默认负载因子(会影响扩容阈值)
static final float DEFAULT_LOAD_FACTOR = 0.75f;
//需要树化时阈值(链表转红黑树)
static final int TREEIFY_THRESHOLD = 8;
//需要去除树化的阈值(红黑树转链表)
static final int UNTREEIFY_THRESHOLD = 6;
//树化最小容量
static final int MIN_TREEIFY_CAPACITY = 64;
//存放元素的哈希表(HashMap容器)
transient Node<K,V>[] table;
//键值对映射数量
transient int size;
//容器被改动的次数
transient int modCount;
//扩容阈值(检测到哈希表的容量大于这个值就对哈希表进行扩容)
int threshold;
//负载因子
final float loadFactor;
HashMap的构造方法
//无参构造
public HashMap() {
//将负载因子设置为控人的负载因子(0.75f)
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
/*
有参构造 初始化容量
可以看到初始化容量的实际上还是调用了HashMap(int initialCapacity, float loadFactor)构造
传入了设置的初始化容量,和默认负载因子
*/
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
/*
带负载因子参数的构造方法
*/
public HashMap(int initialCapacity, float loadFactor) {
//如果传入的默认容量小于零,抛出异常
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
//如果传入的默认的容量比HashMap允许的最大容量还大(2的30次幂),则重置为允许最大容量
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
//如果传入的负载因子小于零或者不是一个数字,抛出异常
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
//设置传入符合条件的负载因子
this.loadFactor = loadFactor;
//设置扩容阈值
this.threshold = tableSizeFor(initialCapacity);
}
/*
此方法通过位运算保证传入的容量值一定是2的幂次方
比如你传入的是15实际上返回的是16
*/
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
put(K key, V value)方法
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
/*
这个函数为扰动函数,为了降低hashcode冲突的概率
那我们来分析一下这个函数是如果实现的
看核心部分的代码 (h = key.hashCode()) ^ (h >>> 16)
代码 h>>>16 是让key的hashcode的二进制数向右无符号移动16位
假如这是hashcode的二进制 0010 0101 0010 0000 0110 0001 0010 0100
右移16位后 ^ 0000 0000 0000 0000 0010 0101 0010 0000
与或后 0010 0101 0010 0000 0100 0100 0000 0100
与或操作后的二进制相比之前hashcode的二进制具有了高位和低位的特征,使得散列的值
就更加分散了
*/
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
//tab 临时哈希表
//p 当前添加元素的节点
//n 哈希表数组的长度
//i 元素在数组中的下标
Node<K,V>[] tab; Node<K,V> p; int n, i;
//如果哈希表为空,或者哈希表长度,就对哈希表进行扩容(扩容解析在下面)
if ((tab = table) == null || (n = tab.length) == 0)
//将扩容后的哈希表给tab 长度给n
n = (tab = resize()).length;
/*
相同的key的hash值一定相同,不同的key的hash值可能相同
对key值进行寻址,如果为空说明计算出来的这个位置没有元素
*/
if ((p = tab[i = (n - 1) & hash]) == null)
//构建新节点,直接放入此位置
tab[i] = newNode(hash, key, value, null);
/*
否则这个位置是有元素的,可能会产生hash冲突
也可能这个节点已经树化了(变成红黑树结构)
*/
else {
//e 临时节点
//K 临时的key值
Node<K,V> e; K k;
/*
如果插入的hash值等于已存在此位置的元素的hash值,并且key值也相等
直接覆盖当前节点的value值
*/
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
//将冲突的节点给临时节点e
e = p;
//此位置节点已经树化了
else if (p instanceof TreeNode)
//直接将此数据插入红黑树中
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
//此位置节点是链表
else {
//遍历链表
for (int binCount = 0; ; ++binCount) {
//如果遍历到链表末尾
if ((e = p.next) == null) {
//将新元素插入到链表末尾
p.next = newNode(hash, key, value, null);
//如果链表长度>8 就将链表树化
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
//如果哈希值和key值都相同说明值相同
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//key已经存在覆盖key相同的value
if (e != null) { // existing mapping for key
//保存旧节点value值
V oldValue = e.value;
//onlyIfAbsent为false代表覆盖值
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
//返回旧节点value值
return oldValue;
}
}
//容器操作值+1
++modCount;
//如果添加元素后实际值达到了扩容阈值再进行扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
/**
*HashMap扩容方法
*/
final Node<K,V>[] resize() {
//旧哈希表
Node<K,V>[] oldTab = table;
//旧容量
int oldCap = (oldTab == null) ? 0 : oldTab.length;
//旧扩容阈值
int oldThr = threshold;
//新哈希表,新扩容阈值
int newCap, newThr = 0;
//如果旧容量>0 说明初始化过
if (oldCap > 0) {
//如果旧容量比最大允许的容量值还大(2的30次方)
if (oldCap >= MAXIMUM_CAPACITY) {
//将下次扩容阈值设置为最大值,不再进行扩容
threshold = Integer.MAX_VALUE;
//直接返回旧哈希表
return oldTab;
}
//否则正常扩容
//如果旧容量扩容两倍小于允许最大容量值并且扩容后的容量大于等于默认的容量(2的四次方)
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
//将新的扩容阈值也扩大两倍
newThr = oldThr << 1; // double threshold
}
//哈希表未初始过(未分配内存空间) HashMap是通过有参构造指定容量去构建的
else if (oldThr > 0) // initial capacity was placed in threshold
//如果旧扩容阈值大于零,就像新容量变成构造时设置的扩容阈值
newCap = oldThr;
//否则HashMap未初始化过(未分配内存空间)
//HashMap通过无参构造创建
else { // zero initial threshold signifies using defaults
//新容量等于默认初始容量(2的4次方)
newCap = DEFAULT_INITIAL_CAPACITY;
//新扩容阈值等于默认负载因子*默认初始化容量(12)
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
//如果新扩容阈值等于零
if (newThr == 0) {
//则将扩容阈值设置为 新容量*负载因子的整数值
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
//设置HashMap扩容阈值
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
//扩容后的哈希表
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
//将扩容后的空哈希表赋值给HashMap的哈希表
table = newTab;
//如果旧哈希表为空说明有元素存在,需要将旧元素转移到新哈希表中
if (oldTab != null) {
//遍历旧哈希表
for (int j = 0; j < oldCap; ++j) {
//临时元素
Node<K,V> e;
//如果当前节点不为空,将当前节点保存至临时节点e
if ((e = oldTab[j]) != null) {
//当前节点释放,方便jvm gc回收
oldTab[j] = null;
//当前节点的后继节点为空,说明当前节点是数组上的单一节点
if (e.next == null)
//计算出当前元素在新哈希表中的位置,直接插入
newTab[e.hash & (newCap - 1)] = e;
//当前节点已经树化(红黑树结构)
else if (e instanceof TreeNode)
//拆分重组树
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
//当前节点为链表
else { // preserve order
/*
下面的代码是对链表扩容的核心,这里的操作主要是将链表拆分成高低位链表
这样链表的平均分散开,查询性能也会大大提高
这条链表通过(hash & oldcap)来计算旧元素的位置在新哈希表的位置是否需要
移动,我们来看扩容前之前元素的位置是用(hash & oldcap-1)
来计算下标位置的,那这次扩容需要用(hash & oldcap)来计算?
那是因为哈希表的长度(oldcap)默认是2的n次幂这代表oldcap的
二进制永远是000001000这种形式,而ladcap-1是000001111这种形式
为了便于理解,就列举两种hash值不同的情况,如果oldcap(扩容前的哈希表)为16
新哈希表newcap为32,那么从未扩容前元素下标位置到扩容后元素下标的位置是
这样变化的
--------------------------------------------------------
(hash & oladcap-1) (hash & oladcap) (hash & newcap-1)
00001 00001 00001
&01111 ==>1 &10000 ==>0 &11111 ==>00001=1
10001 10001 10001
&01111==>1 &10000 ==>1 &11111==>10001=(1+16)=17
----------------------------------------------------------
发现什么规律没有,如果通过 hash & oladcap 计算出来的值等于0,扩容前
和扩容后计算出来的位置是一样的,那当前的要移动的链表节点对应还是放在
和之前就哈希表一样的下标位置上就行,如果 hash & oladcap 为 1,那通过
& 与操作后计算出来的下标值肯定比 hash & oladcap 计算出来的值等于0的
下标多16(因为新哈希表的长度二进制相比之前向左移动了一位),这个元素就放到
新哈希表的(元素在旧哈希表的下标+哈希表的长度)
*/
/*
loHead 低位链表头节点
loTail 低位链表尾节点
hiHead 高位链表头节点
hiTail 高位链表尾节点
next 链表节点的下一节点
*/
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
//当前待处理节点的下一节点
next = e.next;
//判断是否需要移动位置
if ((e.hash & oldCap) == 0) {
//低位链表为空
if (loTail == null)
//将代处理节点给低位链表头节点
loHead = e;
//否则将新待处理节点追加到低位链表尾节点下一节点
else
loTail.next = e;
//第一次将处理节点追加到低位链表尾节点
loTail = e;
}
else {
//高位链表为空
if (hiTail == null)
//将代处理节点给高位链表头节点
hiHead = e;
//否则将新待处理节点追加到高位链表尾节点下一节点
else
hiTail.next = e;
//第一次将处理节点追加到高位链表尾节点
hiTail = e;
}
} while ((e = next) != null);
//如果低位链表尾不等于null
if (loTail != null) {
//低位链表的尾节点指向null
loTail.next = null;
//将低位链表头节点放在新哈希表的原哈希表的下标位置上
newTab[j] = loHead;
}
if (hiTail != null) {
//高位链表的尾节点指向null
hiTail.next = null;
//将高位链表头节点放在新哈希表的原哈希表的下标位置+原哈希表长度位置
newTab[j + oldCap] = hiHead;
}
}
}
}
}
//返回扩容后的新哈希表
return newTab;
}
/*
拆分树
*/
final void split(HashMap<K,V> map, Node<K,V>[] tab, int index, int bit) {
//map 要扩容的HashMap对象
//tab 即将扩容的新哈希表
//index 当前拆分的节点下标
//bit 旧哈希表容量
//调用此方法的红黑树节点对象
TreeNode<K,V> b = this;
// Relink into lo and hi lists, preserving order
//低位头节点和尾节点
TreeNode<K,V> loHead = null, loTail = null;
//高位头节点和尾节点
TreeNode<K,V> hiHead = null, hiTail = null;
int lc = 0, hc = 0;
//遍历红黑树
//创建e,b临时TreeNode节点
for (TreeNode<K,V> e = b, next; e != null; e = next) {
//记录红黑树节点的后继节点
next = (TreeNode<K,V>)e.next;
//将e.next释放,让jvm gc回收
e.next = null;
//将红黑树拆分高低位链表
if ((e.hash & bit) == 0) {
if ((e.prev = loTail) == null)
loHead = e;
else
loTail.next = e;
loTail = e;
++lc;
}
else {
if ((e.prev = hiTail) == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
++hc;
}
}
//如果链表的长度小于等于6则,红黑树转成链表
if (loHead != null) {
if (lc <= UNTREEIFY_THRESHOLD)
tab[index] = loHead.untreeify(map);
else {
tab[index] = loHead;
if (hiHead != null) // (else is already treeified)
loHead.treeify(tab);
}
}
if (hiHead != null) {
if (hc <= UNTREEIFY_THRESHOLD)
tab[index + bit] = hiHead.untreeify(map);
else {
tab[index + bit] = hiHead;
if (loHead != null)
hiHead.treeify(tab);
}
}
}
/*
链表转红黑树(树化)方法
tab 哈希表
hash 新元素key的hash值
*/
final void treeifyBin(Node<K,V>[] tab, int hash) {
//n 哈希表长度
//index 新元素存放的下标位置
//e 临时节点
int n, index; Node<K,V> e;
//如果哈希表为空或者哈希表长度小于可树化容量(64)
if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
//继续扩容,让哈希表长度达到可树化长度
resize();
//否则如果新元素不为空
else if ((e = tab[index = (n - 1) & hash]) != null) {
TreeNode<K,V> hd = null, tl = null;
do {
TreeNode<K,V> p = replacementTreeNode(e, null);
if (tl == null)
hd = p;
else {
p.prev = tl;
tl.next = p;
}
tl = p;
} while ((e = e.next) != null);
if ((tab[index] = hd) != null)
hd.treeify(tab);
}
}
final void treeify(Node<K,V>[] tab) {
TreeNode<K,V> root = null;
for (TreeNode<K,V> x = this, next; x != null; x = next) {
next = (TreeNode<K,V>)x.next;
x.left = x.right = null;
if (root == null) {
x.parent = null;
x.red = false;
root = x;
}
else {
K k = x.key;
int h = x.hash;
Class<?> kc = null;
for (TreeNode<K,V> p = root;;) {
int dir, ph;
K pk = p.key;
if ((ph = p.hash) > h)
dir = -1;
else if (ph < h)
dir = 1;
else if ((kc == null &&
(kc = comparableClassFor(k)) == null) ||
(dir = compareComparables(kc, k, pk)) == 0)
dir = tieBreakOrder(k, pk);
TreeNode<K,V> xp = p;
if ((p = (dir <= 0) ? p.left : p.right) == null) {
x.parent = xp;
if (dir <= 0)
xp.left = x;
else
xp.right = x;
root = balanceInsertion(root, x);
break;
}
}
}
}
moveRootToFront(tab, root);
}
HashMap的扩容方法
/**
*HashMap扩容方法
*/
final Node<K,V>[] resize() {
//旧哈希表
Node<K,V>[] oldTab = table;
//旧容量
int oldCap = (oldTab == null) ? 0 : oldTab.length;
//旧扩容阈值
int oldThr = threshold;
//新哈希表,新扩容阈值
int newCap, newThr = 0;
//如果旧容量>0 说明初始化过
if (oldCap > 0) {
//如果旧容量比最大允许的容量值还大(2的30次方)
if (oldCap >= MAXIMUM_CAPACITY) {
//将下次扩容阈值设置为最大值,不再进行扩容
threshold = Integer.MAX_VALUE;
//直接返回旧哈希表
return oldTab;
}
//否则正常扩容
//如果旧容量扩容两倍小于允许最大容量值并且扩容后的容量大于等于默认的容量(2的四次方)
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
//将新的扩容阈值也扩大两倍
newThr = oldThr << 1; // double threshold
}
//哈希表未初始过(未分配内存空间) HashMap是通过有参构造指定容量去构建的
else if (oldThr > 0) // initial capacity was placed in threshold
//如果旧扩容阈值大于零,就像新容量变成构造时设置的扩容阈值
newCap = oldThr;
//否则HashMap未初始化过(未分配内存空间)
//HashMap通过无参构造创建
else { // zero initial threshold signifies using defaults
//新容量等于默认初始容量(2的4次方)
newCap = DEFAULT_INITIAL_CAPACITY;
//新扩容阈值等于默认负载因子*默认初始化容量(12)
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
//如果新扩容阈值等于零
if (newThr == 0) {
//则将扩容阈值设置为 新容量*负载因子的整数值
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
//设置HashMap扩容阈值
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
//扩容后的哈希表
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
//将扩容后的空哈希表赋值给HashMap的哈希表
table = newTab;
//如果旧哈希表为空说明有元素存在,需要将旧元素转移到新哈希表中
if (oldTab != null) {
//遍历旧哈希表
for (int j = 0; j < oldCap; ++j) {
//临时元素
Node<K,V> e;
//如果当前节点不为空,将当前节点保存至临时节点e
if ((e = oldTab[j]) != null) {
//当前节点释放,方便jvm gc回收
oldTab[j] = null;
//当前节点的后继节点为空,说明当前节点是数组上的单一节点
if (e.next == null)
//计算出当前元素在新哈希表中的位置,直接插入
newTab[e.hash & (newCap - 1)] = e;
//当前节点已经树化(红黑树结构)
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}