jdk 1.8 HashMap
1、数据结构
数组 + 链表/红黑树
2、put 流程图
3、源代码
- 几个重要的常量
// 默认的容量是 16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
// 最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
// 加载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 当结点数超过 8 时,就转换为红黑树
static final int TREEIFY_THRESHOLD = 8;
// 当结点数小于 6 时,就退化成链表
static final int UNTREEIFY_THRESHOLD = 6;
- 重要的字段
// 结点数组
transient Node<K,V>[] table;
// 键值对的数量
transient int size;
// 容量和加载因子的乘积,当 size 大于等于这个值时,就扩容
int threshold;
// 加载因子
final float loadFactor;
// 默认的初始化容量是 16,加载因子为 0.75
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
// tableSizeFor() 将给的容量转换为 2 的幂数
this.threshold = tableSizeFor(initialCapacity);
}
// 指定容量
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR;
}
public HashMap(Map<? extends K, ? extends V> m) {
this.loadFactor = DEFAULT_LOAD_FACTOR;
putMapEntries(m, false);
}
- 当用户输入的容量大小不是 2 的幂数,就将它转换为 2 的幂数
/**
* Returns a power of two size for the given target capacity.
*/
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
// 对外暴露的方法
public V put(K key, V value) {
// hash(key) 计算 hash 值
return putVal(hash(key), key, value, false, true);
}
static final int hash(Object key) {
int h;
// 扰动函数,可以减少 hash 冲突
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
// tab 为空,第一次 put 数据
if ((tab = table) == null || (n = tab.length) == 0)
// resize() 扩容
n = (tab = resize()).length;
// tab[i] 不存在
if ((p = tab[i = (n - 1) & hash]) == null)
// 新建结点
tab[i] = newNode(hash, key, value, null);
else { // tab[i] 存在,往链表,或者红黑树中添加结点
Node<K,V> e; K k;
// 当前结点的 hash 值和 key 值都与新加结点相同
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
// 替换原来的结点
e = p;
// 如果是树结构
else if (p instanceof TreeNode)
//
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else { // 是链表结构
// 遍历链表去添加结点
for (int binCount = 0; ; ++binCount) {
// 下一个结点为空,直接链接在后面
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
// 判断结点数是否大于 8
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
// 转换为红黑树
treeifyBin(tab, hash);
break;
}
// 当前结点与插入结点的 hash 值,key 值相同
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
// 跳转循环
break;
// 用于循环遍历,和上边的 e = p.next构成循环
p = e;
}
}
// 存在当前结点与插入结点的 hash 值,key 值相同,更新值
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
// 判断是否需要扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
4、在 HashMap 中设置容量为什么是 2 的 n 次幂?
- 取余(%)操作中如果除数是2的幂次则等价于与其除数减一的与(&)操作(也就是说 hash%length==hash&(length-1)的前提是 length 是2的 n 次方),而且与运算的效率要高于取模
- 在扩容的时候要进行数据迁移,就需要重新计算所有值的 hash 值,去寻找相应的位置,但如果是 2 的次幂,只需要计算移动的位数,降低了复杂性