1、底层存储介绍
HashMap底层采用了哈希表、而哈希表是由数组和链表实现的。数组和链表各有自己的特点:
- 数组:占用空间连续。 寻址容易,查询速度快。但是,增加和删除效率非常低。
- 链表:占用空间不连续。 寻址困难,查询速度慢。但是,增加和删除效率非常高。
所以HashMap既有数组的优点也有链表的优点(即查询快,增删效率也高)。
在哈希表中,当数组长度小于64,或数组上存储的节点个数小于等于8时数组上的链表是单链表的形式。
当数组长度达到了64或以上,且数组上存储的节点个数大于8时,则会数组上的单链表会转化为红黑树。
2、成员变量
/**
* 默认初始化容量为16,并且必须为2的次幂
*/
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
/**
*最大容量,如果任意一个带有参数的构造函数隐式指定更高的值,则使用该最大容量。
*必须是两个<= 1 << 30的幂。
*/
static final int MAXIMUM_CAPACITY = 1 << 30;
/**
* 在构造函数中未指定时使用的负载系数,默认是0.75.就是当你数组的长度达到这个系数乘积值时,数组就开始扩容
*/
static final float DEFAULT_LOAD_FACTOR = 0.75f;
/**
* 列表转化为红黑树的阈值(临界值)
*/
static final int TREEIFY_THRESHOLD = 8;
/**
* 红黑树转化为链表的阈值
*/
static final int UNTREEIFY_THRESHOLD = 6;
/**
* 当单个数组所指链表长度大于8,要转化为红黑树数组长度的阈值
*/
static final int MIN_TREEIFY_CAPACITY = 64;
/**
* 记录map中键值对的数量的值
*/
transient int size;
/**
* 存放链表或者红黑树的数组
*/
transient Node<K,V>[] table;
3、HashMap 中存储元素的节点类型
- Node 类(单向链表节点)
static class Node<K,V> implements Map.Entry<K,V> {
// 存放key的哈希值
final int hash;
// key的值
final K key;
// value值
V value;
// 下一个节点
Node<K,V> next;
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
public final K getKey() { return key; }
public final V getValue() { return value; }
public final String toString() { return key + "=" + value; }
public final int hashCode() {
return Objects.hashCode(key) ^ Objects.hashCode(value);
}
public final V setValue(V newValue) {
V oldValue = value;
value = newValue;
return oldValue;
}
public final boolean equals(Object o) {
if (o == this)
return true;
if (o instanceof Map.Entry) {
Map.Entry<?,?> e = (Map.Entry<?,?>)o;
if (Objects.equals(key, e.getKey()) &&
Objects.equals(value, e.getValue()))
return true;
}
return false;
}
}
- TreeNode类(红黑树节点)
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
// 父节点
TreeNode<K,V> parent; // red-black tree links
// 左子节点
TreeNode<K,V> left;
// 右子节点
TreeNode<K,V> right;
// 当前节点的前节点
TreeNode<K,V> prev; // needed to unlink next upon deletion
// true表示红树,false为黑树
boolean red;
TreeNode(int hash, K key, V val, Node<K,V> next) {
super(hash, key, val, next);
}
/**
* Returns root of tree containing this node.
*/
final TreeNode<K,V> root() {
for (TreeNode<K,V> r = this, p;;) {
if ((p = r.parent) == null)
return r;
r = p;
}
}
- treeNode继承了node类所以node可以存放treeNode。
4、数组初始化
在 JDK1.8 的 HashMap 中对于数组的初始化采用的是延迟初始化方式。通过 resize 方法 实现初始化处理。resize 方法既实现数组初始化,也实现数组扩容处理。
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
// oldCap = 0
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
else { // zero initial threshold signifies using defaults
// DEFAULT_INITIAL_CAPACITY常量表示数组的默认值为16所以newCap=16
newCap = DEFAULT_INITIAL_CAPACITY;
// newThr为0.75*16=12
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
// 新建一个长度为16的数组
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
// 并且将值赋给表示hashMap数组的变量table
table = newTab;
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
// 返回初始化好了的数组,长度为16
return newTab;
}
5、计算 Hash 值
- 获得 key 对象的 hashcode
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
- 先将key的hashCode值与key的hashCode值的高16位进行异或运算得出第一次的hash值。
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); // 将key的hashCode值与key的hashCode值的高16位进行异或运算
}
- 再进行一次与当前数组长度进行一次且运算,最后得出hashCode的值。
6、添加元素
- 当元素key的hashCode未发生冲突时会直接存入map中的table中作为节点的第一个元素。
- 当发生hash冲突时、key和冲突元素key值相同时,新的元素的value会直接替换掉老的value。
- 当发生hash冲突时、key和冲突元素不相同时,他会先判断该hash地址中数组上的节点是不是红黑树,如果是红黑树就直接进行树的操作,如果不是红黑树并且此时的节点个数没有8个以上,如果有会在判断当前数组的长度有没有64以上,如果都满足会进行转化为红黑树的操作、如果数组的长度小于64,则会扩容数组,再直接将该节点挂载到单链表的末尾。若都不满足则直接挂载到链表的末尾。
7、数组扩容
hashMap中每次数组的长度达到了他扩容的阈值默认是0.75,他就会扩容,并且每次都是原来数组长度的2倍。创建一个新的数组后,他会把老数组里的值移动到新的数组里面。
8、拓展
多并发情况下循环链表的产生
jdk 1.7 头插法循环链表的产生
jdk 1.8 采用尾插法解决循环链表问题