一.处识HashMap
1.基于哈希表的 Map 接口的实现。此实现提供所有可选的映射操作,并允许使用 null 值和 null 键(除了非同步和允许使用 null 之外,HashMap 类与 Hashtable 大致相同。)--- 百度百科
2.线程不安全,JDK8中使用 数组 + 链表 + 红黑树 实现,当链表个数>=8且数组个数>64时候,会进行链表->红黑树(树化),当树的节点<6的时候会恢复到链表。Map 是一个键值对集合,存储键、值和之间的映射。 Key 无序,唯一; value 不要求有序,允许重复。 Map 没有继承于 Collection 接口,从 Map 集合中检索元素时,只要给出键对象,就会返回对应的值对象。
二.源码解析
1.构造方法及重要参数
// 容量、负载因子
public HashMap(int initialCapacity, float loadFactor) {
// 这里的代码片段可以不看 都是判断 异常报错
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
// 主要是这里 负载因子和扩容阈值
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
}
// 容量
public HashMap(int initialCapacity) {
// 有参构造 负载因子默认0.75
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
// 无参构造
public HashMap() {
// 默认赋值负载因子0.75
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
public HashMap(Map<? extends K, ? extends V> m) {
this.loadFactor = DEFAULT_LOAD_FACTOR;
putMapEntries(m, false);
}
// 默认初始长度16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
// 默认最大容量2^30
static final int MAXIMUM_CAPACITY = 1 << 30;
// 默认负载因子0.75
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 树化的条件一 链表中节点>8
static final int TREEIFY_THRESHOLD = 8;
// 去树化的条件 链表中节点<=6
static final int UNTREEIFY_THRESHOLD = 6;
// 树化的条件二 数组长度>64
static final int MIN_TREEIFY_CAPACITY = 64;
2.核心代码 putVal
// 这是我们平常使用HashMap存值的语句 其实底层调的是PutVal
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
// 第一次存值的时候,table为空 所以会进行扩容操作resize 这个后面再看
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 这里是获取我们数组的下标
// (n - 1) & hash n:表示数组的长度 hash为key的hash值
// 其实是key的hashcode和它自身右移16位 做相与运算得出来的结果
if ((p = tab[i = (n - 1) & hash]) == null)
// 判断数组是否为空 为空我们直接存储
tab[i] = newNode(hash, key, value, null);
else {
// 如果没有走上面代码 就说明不是数组存在且key要存的位置不为空
Node<K,V> e; K k;
// 用hash和equals来判断是否相等 如果相等就更新值
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// 判断该点是否是树节点 也就是判断数组现在的存储形式是链表还是树
else if (p instanceof TreeNode)
// 如果是树节点 存进树中
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
// 否则 则为链表节点 循环遍历链表
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
// 这里上面提到 如果链表长度>8 则会进行树化
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
// 如果找到了 退出循环 在循环外进行更新操作
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
// 这里就是更新操作 e为旧节点
if (e != null) { // existing mapping for key
// 这里用oldValue变量来存储值 因为我们的put方法会返回旧的值 也就是这个
V oldValue = e.value;
// 更新节点中的值
if (!onlyIfAbsent || oldValue == null)
e.value = value;
// 空方法 标记作用
afterNodeAccess(e);
return oldValue;
}
}
// 如果更新值 则不会走到这里
// 相反 如果是插入新值 使modCount++
++modCount;
// 判断是否扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
3. 核心代码 resize
// 扩容方法
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
// 如果走了这个if分支 说明是扩容并不是新建数组
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
// 新的阈值更新为旧的两倍
newThr = oldThr << 1; // double threshold
}
// 如果走了这个分支 说明是我们调用了有参构造方法
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
// 如果走了这个分支 说明是我们调用了无参构造方法
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
// 如果走了这个分支 说明是我们调用了有参构造方法
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
// 判断容器长度*负载因子是否大于最大值
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
// 新建Node数组
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
// 如果扩容会走这里 如果是新建则直接返回上面那个newTab数组
if (oldTab != null) {
// 循环遍历数组下的元素
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
// 如果数组不为空
if ((e = oldTab[j]) != null) {
// 将旧的置空
oldTab[j] = null;
// 如果下一个节点为空
if (e.next == null)
// 这里就是更新扩容后的数组
newTab[e.hash & (newCap - 1)] = e;
// 判断是否为树节点
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
// 如果下个节点不为空
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
// 开始遍历链表
next = e.next;
// 这里判断的是扩容前数组中某个值与扩容前数组长度的与
// 旨在求这个值在扩容后数组的位置 如果为0则说明它在扩容后还在原位
if ((e.hash & oldCap) == 0) {
//如果为空 说明旧数组还没有元素
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
// 这里就跟上面的情况相反
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
//如果 loTail 不为空,表示旧桶中存在元素需要放入新桶的范围内。
//在此处,将 loTail 的 next 指针置为 null,以将链表截断。
//然后将 loHead(旧桶中的链表头)放入新哈希表中索引位置 j 处。
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
三、总结
初始化时,第一次putVal,如果是无参构造,会默认容量为16,负载因子为0.75,阈值为16*0.75=12,此后扩容两倍扩容
如果是有参构造,第一次putVal,长度为传入的参数,也是两倍扩容
当链表节点>8且数组长度>=64(这个在 treeifyBin 方法中呈现,有兴趣可以康康)时会进行树化 链表中节点小于等于6会去树化