JDK1.8 之前 HashMap
由数组+链表组成的,数组是 HashMap
的主体,链表则是主要为了解决哈希冲突而存在的(“拉链法”解决冲突)。JDK1.8 以后在解决哈希冲突时有了较大的变化,当链表长度大于阈值(默认为 8)(将链表转换成红黑树前会判断,如果当前数组的长度小于 64,那么会选择先进行数组扩容,而不是转换为红黑树)时,将链表转化为红黑树,以减少搜索时间。
一、基本定义
// 初始容量是16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
// 最大容量是2^30
static final int MAXIMUM_CAPACITY = 1 << 30;
// 负载因子为0.75,因此阈值=16*0.75=12
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 如果一个hash桶中的节点数达到8,下次添加新节点时,会把这个hash桶的所有节点用红黑树保存
// 如果数组table的长度不足64,那么也不转化为红黑树,改为扩容一次
static final int TREEIFY_THRESHOLD = 8;
// 如果一棵红黑树的节点减少到6,那么就把它退化为链表保存
static final int UNTREEIFY_THRESHOLD = 6;
// 转化为红黑树的另一个条件。table的长度不足这个值时,不转化为红黑树,改为扩容一次
static final int MIN_TREEIFY_CAPACITY = 64;
二、构造函数
HashMap 构造方法做的事情比较简单,一般都是初始化一些重要变量,比如 loadFactor 和 threshold。
// 构造方法1
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
}
// 构造方法2
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
// 构造方法3
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
// 构造方法4
public HashMap(Map<? extends K, ? extends V> m) {
this.loadFactor = DEFAULT_LOAD_FACTOR;
putMapEntries(m, false);
}
// 求得大于等于cap的最小2次幂
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
问题:为什么阈值是通过tableSizeFor求得?构造方法中并没有初始化数组,更没有保存定义数组长度的initialCapacity,那是如何初始化的呢?
这个问题将结合后续扩容机制的resize()方法详细说明。
三、查找
HashMap 的查找操作比较简单,即先定位键值对所在的桶的位置,然后再对链表或红黑树进行查找,通过这两步即可完成查找。
public V get(Object key) {
Node<K,V> e;
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
//扰动函数
static final int hash