hashMap的实现原理
-
Java8以前底层数据结构:数组+链表。
-
Java8及以后底层数据结构:数组+链表+红黑树。默认情况下链表长度超过8变成红黑树(整个hashMap元素数量超过64),红黑树节点树小于6变回链表。
hashMap是如何解决hash冲突的问题的
-
如果发生了碰撞,新添加的元素将以链表的方式链接到后面。
-
如果链表长度超过阀值,就把链表转成红黑树。
-
如果链表长度低于6,就把红黑树转回链表。
hashMap的扩容
数组每个下标对应的位置称为hash槽,默认情况下,当拥有元素的hash槽数量超过当前容量乘以0.75,就会触发扩容操作,扩容为当前容量的2倍。
源码翻看
hashMap的属性
public class HashMap<K,V> extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable {
//序列号,序列化的时候使用。
private static final long serialVersionUID = 362498820763181265L;
/**
* 默认容量,1向左移位4个,00000001变成00010000,也就是2的4次方为16
* 使用移位是因为移位是计算机基础运算,效率比加减乘除快。
**/
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
//最大容量,2的30次方。
static final int MAXIMUM_CAPACITY = 1 << 30;
//加载因子,用于扩容使用。这个参数的意义是:当数组长度达到当前长度 * 0.75时 需要扩容了!
static final float DEFAULT_LOAD_FACTOR = 0.75f;
//当某个桶节点数量大于8时,会转换为红黑树。
static final int TREEIFY_THRESHOLD = 8;
//当某个桶节点数量小于6时,会转换为链表,前提是它当前是红黑树结构。
static final int UNTREEIFY_THRESHOLD = 6;
//当整个hashMap中元素数量大于64时,也会进行转为红黑树结构。
static final int MIN_TREEIFY_CAPACITY = 64;
//存储元素的数组,transient关键字表示该属性不能被序列化
transient Node<K,V>[] table;
//将数据转换成set的另一种存储形式,这个变量主要用于迭代功能。
transient Set<Map.Entry<K,V>> entrySet;
//元素数量
transient int size;
//统计该map修改的次数
transient int modCount;
//临界值,也就是元素数量达到临界值时,会进行扩容。
int threshold;
//也是加载因子,只不过这个是变量。
final float loadFactor;
构造方法
构造方法中 ,都是依靠第三个方法来执行的,但是前三个方法都没有进行数组的初始化操作,即使调用了构造方法此时存放HaspMap中数组元素的table表长度依旧为0 。在第四个构造方法中调用了inflateTable()方法完成了table的初始化操作,并将m中的元素添加到HashMap中。
/**
* 构造方法 1 无参构造方法,使用默认初始容量16与默认负载因子0.75构造一个空的HashMap。
*/
public HashMap() {
// 初始化加载因子
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
/**
* 构造方法 2 传入初始容量,通过默认负载因子构造一个空的HashMap
* 调用了HashMap(int initialCapacity, float loadFactor)构造方法。
*/
public HashMap(int initialCapacity) {
// 调用构造方法3,并传入加载因子
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
/**
* 构造方法 3 传入初始容量和负载因子来构造一个空的HashMap。
*/
public HashMap(int initialCapacity, float loadFactor) {
// 初始容量不能小于0
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity);
// 初始容量不能大于MAXIMUM_CAPACITY(最大容量)
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
// 校验负载因子合法性
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " + loadFactor);
this.loadFactor = loadFactor;
// 计算下次resize的阈值
this.threshold = tableSizeFor(initialCapacity);
}
/**
* 构造方法 4 指定集合,转化为HashMap,使用默认初始容量与默认负载因子。
*/
public HashMap(Map<? extends K, ? extends V> m) {
// 初始化加载因子
this.loadFactor = DEFAULT_LOAD_FACTOR;
// 将m中的所有元素添加至hashMap中
putMapEntries(m, false);
}
final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
//获取该map的实际长度
int s = m.size();
if (s > 0) {
//判断table是否初始化,如果没有初始化
if (table == null) { // pre-size
/**
* 求出需要的容量,因为实际使用的长度=容量*0.75得来的,
* +1是因为小数相除,基本都不会是整数,容量大小不能为小数的,
* 后面转换为int,多余的小数就要被丢掉,所以+1,
* 例如,map实际长度22,22/0.75=29.3,所需要的容量肯定为30,
* 如果刚刚好除得整数呢,除得整数的话,容量大小多1也没什么影响
**/
float ft = ((float)s / loadFactor) + 1.0F;
//判断该容量大小是否超出上限。
int t = ((ft < (float)MAXIMUM_CAPACITY) ? (int)ft : MAXIMUM_CAPACITY);
/**
* 对临界值进行初始化,tableSizeFor(t)这个方法会返回大于t值的,且离其最近的2次幂,
* 例如t为29,则返回的值是32
**/
if (t > threshold)
threshold = tableSizeFor(t);
}
//如果table已经初始化,则进行扩容操作,resize()就是扩容。
else if (s > threshold)
resize();
//遍历,把map中的数据转到hashMap中。
for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
K key = e.getKey();
V value = e.getValue();
putVal(hash(key), key, value, false, evict);
}
}
}
扩容方法
final Node<K,V>[] resize() {
// 把之前的数组变成 oldTab
Node<K,V>[] oldTab = table;
//old 的长度
int oldCap = (oldTab == null) ? 0 : oldTab.length;
//old 的临界值
int oldThr = threshold;
//初始化new的长度和临界值
int newCap, newThr = 0;
//oldCap > 0也就是说不是首次初始化,因为hashMap用的是懒加载
if (oldCap > 0) {
// 大于最大值
if (oldCap >= MAXIMUM_CAPACITY) {
//临界值为整数的最大值
threshold = Integer.MAX_VALUE;
return oldTab; // 不需要扩容,直接返回 old
}
// 没有超过最大值,扩容两倍,并且扩容后的长度要小于最大值,old 长度也要大于16
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
// 临界值扩容为 old 的临界值2倍
newThr = oldThr << 1;
}
/**
* 如果oldCap<0,但是已经初始化了,像把元素删除完之后的情况,那么它的临界值肯定还存在,
* 如果是首次初始化,它的临界值则为0
**/
else if (oldThr > 0) // old 的临界值 大于0
newCap = oldThr;
// 首次初始化,给与默认的值
else {
newCap = DEFAULT_INITIAL_CAPACITY;
// 临界值 等于 容量 * 加载因子
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
// 初始化时容量小于默认值16的,此时newThr没有赋值,计算新的resize上限
if (newThr == 0) {
// new的临界值
float ft = (float)newCap * loadFactor;
// 判断是否new容量是否大于最大值,临界值是否大于最大值
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
// 把上面各种情况分析出的临界值,在此处真正进行改变,也就是容量和临界值都改变了。
threshold = newThr;
// 表示忽略该警告
@SuppressWarnings({"rawtypes","unchecked"})
// 初始化
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
// 赋予当前的table
table = newTab;
// 此处是把old中的元素,遍历到new中
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
// 临时变量
Node<K,V> e;
// 当前哈希桶的位置值不为null,也就是数组下标处有值,因为有值表示可能会发生冲突
if ((e = oldTab[j]) != null) {
// 把已经赋值之后的变量置位null,为了好回收,释放内存
oldTab[j] = null;
// 如果下标处的节点没有下一个元素
if (e.next == null)
// 把该变量的值存入newCap中,e.hash & (newCap - 1)并不等于j
newTab[e.hash & (newCap - 1)] = e;
// 该节点为红黑树结构,也就是存在哈希冲突,该哈希桶中有多个元素
else if (e instanceof TreeNode)
//把此树进行转移到newCap中
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else {
/**
* 此处表示为链表结构,同样把链表转移到newCap中,
* 就是把链表遍历后,把值转过去,在置位null
**/
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
// 原索引
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
// 原索引+oldCap
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
//返回扩容后的hashMap
return newTab;
}
添加方法
public V put(K key, V value) {
/**
* 四个参数,
* 第一个hash值,
* 第四个参数表示如果该key存在值,如果为null的话,则插入新的value,
* 最后一个参数,在hashMap中没有用,可以不用管,使用默认的即可
**/
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
// tab 哈希数组,p 该哈希桶的首节点,n hashMap的长度,i 计算出的数组下标
Node<K,V>[] tab; Node<K,V> p; int n, i;
// 获取长度并进行扩容,使用的是懒加载,table一开始是没有加载的,等put后才开始加载
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
/**
* 如果计算出的该哈希桶的位置没有值,则把新插入的key-value放到此处,
* 此处就算没有插入成功,也就是发生哈希冲突时也会把哈希桶的首节点赋予p
**/
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
//发生哈希冲突的几种情况
else {
// e 临时节点的作用, k 存放该当前节点的key
Node<K,V> e; K k;
// 第一种,插入的key-value的hash值,key都与当前节点的相等,e = p,则表示为首节点
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// 第二种,hash值不等于首节点,判断该p是否属于红黑树的节点
else if (p instanceof TreeNode)
/**
* 为红黑树的节点,则在红黑树中进行添加,
* 如果该节点已经存在,则返回该节点(不为null),
* 该值很重要,用来判断put操作是否成功,如果添加成功返回null
**/
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
// 第三种,hash值不等于首节点,不为红黑树的节点,则为链表的节点
else {
// 遍历该链表
for (int binCount = 0; ; ++binCount) {
// 如果找到尾部,则表明添加的key-value没有重复,在尾部进行添加
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
// 判断是否要转换为红黑树结构
if (binCount >= TREEIFY_THRESHOLD - 1)
treeifyBin(tab, hash);
break;
}
// 如果链表中有重复的key,e则为当前重复的节点,结束循环
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
// 在循环中判断e是否为null,如果为null则表示加了一个新节点,
// 不是null则表示找到了hash、key都一致的Node。
if (e != null) {
V oldValue = e.value;
// 判断是否更新value值
// map提供putIfAbsent方法,如果key存在,不更新value
// 但是如果value==null任何情况下都更改此值
if (!onlyIfAbsent || oldValue == null)
e.value = value;
// 此方法是空方法,什么都没实现,用户可以根据需要进行覆盖
afterNodeAccess(e);
return oldValue;
}
}
// 到了此步骤,则表明待插入的key-value是没有key的重复,因为插入成功e节点的值为null
// 修改次数+1
++modCount;
// 实际长度+1,判断是否大于临界值,大于则扩容
if (++size > threshold)
resize();
// 此方法是空方法,什么都没实现,用户可以根据需要进行覆盖
afterNodeInsertion(evict);
// 添加成功
return null;
}
删除方法
public V remove(Object key) {
//临时变量
Node<K,V> e;
/**
* 调用removeNode(hash(key), key, null, false, true)进行删除,
* 第三个value为null,表示,把key的节点直接都删除了,不需要用到值,
* 如果设为值,则还需要去进行查找操作
**/
return (e = removeNode(hash(key), key, null, false, true)) == null ?
null : e.value;
}
/**
* 第一参数为哈希值,
* 第二个为key,
* 第三个value,
* 第四个为是为true的话,则表示删除它key对应的value,不删除key,
* 第四个如果为false,则表示删除后,不移动节点
**/
final Node<K,V> removeNode(int hash, Object key, Object value,
boolean matchValue, boolean movable) {
// tab 哈希数组,p 数组下标的节点,n 长度,index 当前数组下标
Node<K,V>[] tab; Node<K,V> p; int n, index;
// 哈希数组不为null,且长度大于0,然后获得到要删除key的节点所在是数组下标位置
if ((tab = table) != null && (n = tab.length) > 0 &&
(p = tab[index = (n - 1) & hash]) != null) {
// nodee 存储要删除的节点,e 临时变量,k 当前节点的key,v 当前节点的value
Node<K,V> node = null, e; K k; V v;
// 如果数组下标的节点正好是要删除的节点,把值赋给临时变量node
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
node = p;
// 也就是要删除的节点,在链表或者红黑树上,先判断是否为红黑树的节点
else if ((e = p.next) != null) {
if (p instanceof TreeNode)
// 遍历红黑树,找到该节点并返回
node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
else { // 表示为链表节点,一样的遍历找到该节点
do {
if (e.hash == hash &&
((k = e.key) == key ||
(key != null && key.equals(k)))) {
node = e;
break;
}
/**
* 注意,如果进入了链表中的遍历,那么此处的p不再是数组下标的节点,
* 而是要删除结点的上一个结点
**/
p = e;
} while ((e = e.next) != null);
}
}
// 找到要删除的节点后,判断!matchValue,我们正常的remove删除,!matchValue都为true
if (node != null && (!matchValue || (v = node.value) == value ||
(value != null && value.equals(v)))) {
// 如果删除的节点是红黑树结构,则去红黑树中删除
if (node instanceof TreeNode)
((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
// 如果是链表结构,且删除的节点为数组下标节点,也就是头结点,直接让下一个作为头
else if (node == p)
tab[index] = node.next;
else
/**
* 为链表结构,删除的节点在链表中,把要删除的下一个结点设为上一个结点的下一个节点
**/
p.next = node.next;
// 修改计数器
++modCount;
// 长度减一
--size;
/**
* 此方法在hashMap中是为了让子类去实现,主要是对删除结点后的链表关系进行处理
**/
afterNodeRemoval(node);
// 返回删除的节点
return node;
}
}
// 返回null则表示没有该节点,删除失败
return null;
}
获取方法
public V get(Object key) {
Node<K,V> e;
//也是调用getNode方法来完成的
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node<K,V> getNode(int hash, Object key) {
// first 头结点,e 临时变量,n 长度,k key
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
// table不为空 && table长度大于0 && table索引位置(根据hash值计算出)节点不为空
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
// first的key等于传入的key则返回first对象
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
//first的key不等于传入的key则说明是链表,向下遍历
if ((e = first.next) != null) {
// 判断是否为TreeNode,是则为红黑树
// 如果是红黑树节点,则调用红黑树的查找目标节点方法getTreeNode
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
do {
//走下列步骤表示是链表,循环至节点的key与传入的key值相等
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
//找不到符合的返回空
return null;
}
计算哈希
static final int hash(Object key) {
int h;
// 如果key == null 则将数据存入下标0的位置
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
总结:
- 所以key值可以为null,存入下标0的位置
- 默认创建的hashmap默认长度为16
- HashMap使用的是懒加载,构造完HashMap对象后,只要不进行put 方法插入元素,HashMap并不会去初始化或者扩容table。当首次调用put方法时,HashMap会发现table为空然后调用resize方法进行初始化