学习交流群:817080571
HashMap实现原理
JDK1.7HashMap(提一下,后面就不提了)
JDK1.7HashMap底层是由数组加链表的形式组成
模型
JDK1.8HashMap
JDK1.8HashMap底层是由数组加链表以及红黑树实现的
模型
HashMap常见的变量
默认大小
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
HashMap底层是由数组组成,初始大小为16,也可以自己设置初始大小,推荐使用2的幂数,就算没啥用,HashMap也会帮我们自动变更为最接近的2的幂数倍
最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
HashMap最大容量为2的30幂
扩容因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
HashMap默认的扩容因子为0.75f,也可以自己设置扩容因子
为什么扩容因子设置为0.75f
- 根据泊松分布,0.75的空间利用和查询时间消耗都是最优的
- 如果扩容因子为1的话,这样空间利用是最好的,但是查询的时间大大提高了,并且hash碰撞的次数变多了。
- 如果扩容因子为0.5的话,这样查询的时间大大减少了,但是空间利用就浪费了很多,并且rehash的次数变多了。
链表转红黑树
static final int TREEIFY_THRESHOLD = 8;
当链表长度为8后,链表会转为红黑树(长度为8时,还是用链表存储,从第9个元素才会开始重新用红黑树存储,)
为什么链表长度为8转成红黑树
因为节点的发布会遵守泊松发布,一个链表长度为8的时候,发生hash碰撞的机会基本为0,(默认扩容因子的情况下)
链表转红黑树需求
static final int MIN_TREEIFY_CAPACITY = 64;
只有当桶的长度为64及以上,才会转红黑树,否则,就算,链表长度大于8了,还是以链表形式存储
红黑树转链表
static final int UNTREEIFY_THRESHOLD = 6;
当红黑树元素个数少于6个的时候才会转链表(个数为6的时候还是红黑树,为5的时候才开始重新用链表存储)
HashMap存储方式
Node<K,V> 类
成员变量
final int hash;
final K key;
V value;
Node<K,V> next;
hash值
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
获取这个类对象变量key的值,如果这个键为空,则这个Enrty的hash值为0
如果键不为空,则hash值为键的hashcode值异或上h>>>16(h取出高16位)(解释>>>:无符号右移16个位置)
next
因为是用链表实现的,所以next是用来存储下标相同但hash值不同的Entry
方法
HashCode
public final int hashCode() {
return Objects.hashCode(key) ^ Objects.hashCode(value);
}
存储对象的hashcode值由键的hashcode值异或上值的hashcode值
equals
public final boolean equals(Object o) {
if (o == this)
return true;
if (o instanceof Map.Entry) {
Map.Entry<?,?> e = (Map.Entry<?,?>)o;
if (Objects.equals(key, e.getKey()) &&
Objects.equals(value, e.getValue()))
return true;
}
return false;
}
首先判断传入对象和当前hashmap内存地址是否一样,如果一样就返回true,如果不一样在判断,传入对象是否被包含在当前hashmap类,如果在就判断,key和value值是否相等,如果相等返回true,否则就返回false
HashMap构造方法
无参构造方法
/**
* Constructs an empty <tt>HashMap</tt> with the default initial capacity
* (16) and the default load factor (0.75).
*/
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
用默认的初始容量构造一个空的HashMap(16)和默认荷载系数(0.75)。
一个参数构造方法
/**
* Constructs an empty <tt>HashMap</tt> with the specified initial
* capacity and the default load factor (0.75).
*
* @param initialCapacity the initial capacity.
* @throws IllegalArgumentException if the initial capacity is negative.
*/
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
调用两个参数的构造方法,将扩容因子设置为默认扩容因子
两个参数构造方法
/**
* Constructs an empty <tt>HashMap</tt> with the specified initial
* capacity and load factor.
*
* @param initialCapacity the initial capacity
* @param loadFactor the load factor
* @throws IllegalArgumentException if the initial capacity is negative
* or the load factor is nonpositive
*/
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
}
HashMap的添加方法
public V put(K key, V value) {
//调用putVal方法(传入五个参数)
//key的hash值,
//key,
//value,
//是否是创建模式
//是否允许linkedhashmap后置操作
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
//tab 哈希数组,p 该哈希桶的首节点,n hashMap的长度,i 计算出的数组下标
Node<K,V>[] tab; Node<K,V> p; int n, i;
//判断table是否加载过,如果没有就进行加载,默认table是懒加载,需要put才能初始化,
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//判断当前位置是否为空,如果为空,就把key-value存储到这个位置
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
//该位置已经有值,发送了hash碰撞
else {
// e 临时节点的作用, k 存放该当前节点的key
Node<K,V> e; K k;
//判断插入的节点hash值和当前节点的hash值是否相等,已经key是否为空,相等,则进行覆盖
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//如果不是首节点,则判断p是不是红黑树的节点
else if (p instanceof TreeNode)
//如果是节点,则判断该节点是否存在,如果已经存在就覆盖,不存在就往后添加
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
//第三种,不是首节点,也不是红黑树节点,则为链表的节点
else {
//for循环进行遍历
for (int binCount = 0; ; ++binCount) {
//如果找到最后一个节点都没找到,则往后添加
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
//判断是否转为红黑树
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
//如果找到了,则覆盖
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//有重复的key,则用待插入值进行覆盖,返回旧值。
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
//到了此步骤,则表明待插入的key-value是没有key的重复,因为插入成功e节点的值为null
//修改次数+1
++modCount;
//实际长度+1,判断是否大于临界值,大于则扩容
if (++size > threshold)
resize();
//允许linkedhashmap后置操作
afterNodeInsertion(evict);
//操作成功
return null;
}
- 首先判断插入的key值是否为空,如果为空,因为HashMap允许存入空值,但是只能存储一个key为空的值,这个key-value存储到下标为0的位置
- 如果key不为空,就放到数组中,用hash值寻找下标,如果该位置为空,则在该位置添加该key-value
- 如果该位置有值了,则发生了hash碰撞,需要先去红黑树中寻找,遍历,看是否为红黑树中的节点,如果存在,并且key也相等,则覆盖值
- 如果红黑树中也没有,则去链表中遍历寻找,找到了与之相等的节点以及key相等,则覆盖
- 如果没有找到,则在链表后面添加该key-value值
HashMap的查询方法
public V get(Object key) {
Node<K,V> e;
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node<K,V> getNode(int hash, Object key) {
//数组 tab 中间节点first ,长度 ,key
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
//判断tab是否为空,长度是否大于0,当前节点是否存在值
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
//判断该位置第一个节点的hash值,key是否相等,如果相等就返回节点
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
//判断当前位置节点是否有下一个节点
if ((e = first.next) != null) {
//有下一个节点,判断该节点是否属于红黑树
if (first instanceof TreeNode)
//属于就返回接单
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
//如果不是红黑树,是链表就遍历循环
do {
//找到了就返回节点
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
//没有就返回null
return null;
}
- 如果key为空,则看看数组下标为0的key是否为空,如果为空就返回下标为0位置的value,如果不为零就返回null
- 如果key不为空,先去数组里面遍历查找,如果存在就返回value
- 如果数组里没有,就去红黑树里查找,判断该节点是否属于红黑树,如果有就返回value
- 如果红黑树里也没有,就去链表中遍历查询,如果有就返回value
- 如果链表中也没有,就返回null
HashMap的扩容方法
final Node<K,V>[] resize() {
//数组,存放需要扩容的数组
Node<K,V>[] oldTab = table;
//老数组的容量,如果数组不存在,就设置为0,
int oldCap = (oldTab == null) ? 0 : oldTab.length;
//
int oldThr = threshold;
//初始化新的容量以及临界值
int newCap, newThr = 0;
//判断老容量是否大于0
if (oldCap > 0) {
//判断老容量是否大于等于最大容量
if (oldCap >= MAXIMUM_CAPACITY) {
//如果大于了,则设置容量为最大容量
threshold = Integer.MAX_VALUE;
//返回出去
return oldTab;
}
//设置新容量为老容量*2并且是否小于最大容量,老容量是否大于等于默认容量
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
//设置新的临界值为上一次的2倍
newThr = oldThr << 1; // double threshold
}
//判断老的临界值是否大于0;
else if (oldThr > 0) // initial capacity was placed in threshold
//大于0,设置新的容量为老的临界值
newCap = oldThr;
else { // zero initial threshold signifies using defaults
//小于0
//新的容量为默认容量
newCap = DEFAULT_INITIAL_CAPACITY;
//新的临界值为默认大小*扩容因子
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
//如果新的临界值为0
if (newThr == 0) {
//则设置临界值为新的容量*扩容因子
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
//设置值为临界值
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
//初始化数组
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
//赋予当前数组
table = newTab;
//如果老的数组不为空
if (oldTab != null) {
//遍历
for (int j = 0; j < oldCap; ++j) {
//临时遍历
Node<K,V> e;
//设置临时遍历值,且不为空
if ((e = oldTab[j]) != null) {
//设置老数组中当前位置为空
oldTab[j] = null;
//判断当前节点是否有下一个节点
if (e.next == null)
//没有则当前位置填入该节点
newTab[e.hash & (newCap - 1)] = e;
//如果当前节点有下一个节点,
//判断该节点是否属于红黑树,也就是存在哈希冲突,该哈希桶中有多个元素
else if (e instanceof TreeNode)
//将此树进行转移到新的数组中
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
//否则表示为链表,将链表转移到新的数组中
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
//返回新的数组
return newTab;
}
- 先判断老容量是否为0,如果为0,初始化数组,用默认的大小以及扩容因子
- 如果不为0就判断老容量的值是否为最大的容量,如果是,就返回默认的最大容量
- 如果不是,就扩容,将原有的数组大小扩容至2倍,
- 扩容结束后,将原有的数组,重新hash计算小标后转入新的数组中,链表和红黑树跟着数组走
HashMap的删除方法
public V remove(Object key) {
Node<K,V> e;
return (e = removeNode(hash(key), key, null, false, true)) == null ?
null : e.value;
}
final Node<K,V> removeNode(int hash, Object key, Object value,
boolean matchValue, boolean movable) {
//tab 哈希数组 ,数组下标的节点 ,tab的长度,下标
Node<K,V>[] tab; Node<K,V> p; int n, index;
//设置tab,n,p,index的值
//哈希数组不为null,且长度大于0,然后获得到要删除key的节点所在是数组下标位置
if ((tab = table) != null && (n = tab.length) > 0 &&
(p = tab[index = (n - 1) & hash]) != null) {
//临时变量
Node<K,V> node = null, e; K k; V v;
//判断hash值和key值是否相等,如果相等,则把该下标的节点赋值给node
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
node = p;
//如果p有下一节点,则代表是红黑树或者链表,头节点不是的话,在红黑树或者链表在查找
else if ((e = p.next) != null) {
//判断p节点是否属于红黑树
if (p instanceof TreeNode)
//属于, 就把该节点赋值给node
node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
else {
//遍历链表
do {
//判断链表中的节点是否和e节点相等,
if (e.hash == hash &&
((k = e.key) == key ||
(key != null && key.equals(k)))) {
//如果相等,则把e的节点值赋值给node
node = e;
break;
}
//循环查找下一节点,知道没有下一节点
p = e;
} while ((e = e.next) != null);
}
}
//如果找到了节点,就开始删除
if (node != null && (!matchValue || (v = node.value) == value ||
(value != null && value.equals(v)))) {
//如果节点属于红黑树
if (node instanceof TreeNode)
//从红黑树中删除,
((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
//如果是链表,头元素,直接让下一个节点元素覆盖这个头元素
else if (node == p)
tab[index] = node.next;
else
//是链表但不是头元素,则让下一个节点元素覆盖本节点,下一节点为空,则代表,本节点为空
p.next = node.next;
//操作次数+1
++modCount;
//数组大小-1
--size;
//此方法在hashMap中是为了让子类去实现,主要是对删除结点后的链表关系进行处理
afterNodeRemoval(node);
//返回该节点
return node;
}
}
return null;
}
- 如果key为空的话,先判断下标为0位置的key值是否为空,如果为空则删除,否则相反
- 如果key不为空的话,先循环数组,判断头元素中是否有改key值相等,如果有,则判断其hash值是否相等,如果相等就删除
- 如果头元素中没有,就去红黑树中查找,如果红黑树中有该节点,则删除本节点,然后进行左旋或者右旋实现树的平衡
- 如果红黑树也没有则去链表中查找,如果查找到了,则删除
- 如果没有查找到,则返回null