HashMap底层使用数组+链表构成的数据结构,Java8增加了红黑树。
HashMap的每个节点使用key-value存储,Java8叫Node,Java7叫Entry
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
...
}
每个节点存着hash值,key,value,和下一个节点。
HashMap属性及常量
// 初始容量16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
// 哈希表最大容量,一般情况下只要内存够用,哈希表不会出现问题。
static final int MAXIMUM_CAPACITY = 1 << 30;
// 加载因子。初始情况下,当键值对的数量大于 16 * 0.75 = 12 时,就会扩容。
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 链表转成红黑树的阈值
static final int TREEIFY_THRESHOLD = 8;
// 红黑树转成链表的阈值
static final int UNTREEIFY_THRESHOLD = 6;
// 将链表转换成红黑树前会判断,如果当前数组的长度小于 64,那么会选择先进行数组扩容,而不是转换为红黑树,以减少搜索时间
static final int MIN_TREEIFY_CAPACITY = 64;
// 存储元素的数组,总是2的幂次倍
transient Node<k,v>[] table;
// 存放具体元素的集
transient Set<map.entry<k,v>> entrySet;
// 存放元素的个数,不是数组的长度。
transient int size;
// 每次扩容和更改map结构的计数器
transient int modCount;
// 扩容阈值
int threshold;
// 加载因子
final float loadFactor;
loadFactor太大导致查找元素效率低,太小导致数组的利用率低,存放的数据会很分散。loadFactor的默认值为0.75f是官方给出的一个比较好的临界值。
为什么初始容量写成1 << 4,直接写16他不香吗?那为什么是2的幂呢?
我认为写成1<<4的目的主要是提醒开发者,这个地方要是2的幂。
使用2的幂是因为(数组长度-1)值是所有二进制位全为1,以初始长度16为例, 16-1=15。2进制表示是00000000 00000000 00001111只要输入的HashCode本身分布均匀,Hash算法的结果就是均匀的,这是为了实现均匀分布。
为什么转成红黑树的阈值是8?
根据泊松分布定律计算出来的
modCount属性是做什么用的?
见集合(二)LinkedList
常用方法
求hash
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
数组下标计算
这个是Java7有的,Java8可以在put方法里看到,不过不是单独的方法存在。
static int indexFor(int h, int length) {
return h & (length-1);
}
put方法
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
1、对key求hash值,再计算数组下标。
2、如果没有碰撞,插入Node。
3、如果key存在,调用eques方法,相同则覆盖Node。不同尾插进链表。
4、如果链表长度达到阈值8,并且数组容量>= 64,转成红黑树。
5、如果Node数量>阈值(加载因子*容量),扩容。
转成红黑树需要满足两个条件。1、数组容量 >= 64,< 64会先扩容.。 2、链表长度达到8
扩容机制
1、当容量 >= MAXIMUM_CAPACITY,就不再扩容了。新节点就有可能放在数组、链表、红黑树上。碰撞概率会变大。
2、2倍扩容 < MAXIMUM_CAPACITY && 容量 > 16时2倍扩容,不然就扩容到默认值。
3、重新hash,遍历赋值
4、原来的节点会在原来的位置i或者i+扩容量的位置
线程不安全
Java7头插法会造成什么问题
在多线程环境下进行扩容操作时会造成环形链。get的时候循环死锁
Java8为什么线程不安全
在多线程环境下执行put操作时会发生数据覆盖的情况。