简介
HashMap继承了AbstractMap抽象类,实现了Map接口。用来存放键值对。
与HashTable不同,HashMap不是线程安全的(HashTable 线程安全),而且键和值都可以存放null(HashTable键和值都不能存null):
Map<Integer, Integer> hashMap = new HashMap<>();
hashMap.put(1, null);
hashMap.put(null, 1);
Map<Integer, Integer> hashTable = new Hashtable<>();
hashTable.put(1, null); // NullPointerException
hashTable.put(null, 1); // NullPointerException
底层数据结构
HashMap的底层数据结构在JDK1.8版本发生了改动。
1.8 版本之前:HashMap 底层是 数组和链表。HashMap 通过 key 的 hashCode 经过处理得到 hash 值,进而得到元素存放的位置,如果该位置已经有元素,就判断该元素与要存入的元素的 hash 值以及 key 是否相同,如果相同的话,直接覆盖,否则用链表解决哈希冲突。
下图中的数组里存的元素,在HashMap中称为Entry,每个Entry对应着一个链表。
1.8 版本:
底层在数组和链表的基础上增加了红黑树,当链表长度和数组容量到达一定条件时,链表会转换为红黑树,获得 O(n) 到 O(logn)的查询速度的提升。
下图标题应为JDK 1.8之后的HashMap
链表什么时候转为红黑树?
网上有些资料说链表长度大于8时,链表转换为红黑树,其实这个说法是不准确的。链表长度大于8时,HashMap会尝试将链表转换为红黑树,转换前,如果数组容量没到64,则会扩容数组容量为原来的两倍,如果数组容量达到64,链表长度又大于8,才转换为红黑树。
为什么不一开始就用红黑树?
红黑树的查询效率比链表快,那为什么不一开始就用红黑树,而是用链表呢?
先说结论:红黑树节点比链表节点占内存。
JDK1.8源码有下面这句话:
Because TreeNodes are about twice the size of regular nodes, we
use them only when bins contain enough nodes to warrant use
(see TREEIFY_THRESHOLD). And when they become too small (due to
removal or resizing) they are converted back to plain bins.
因为树节点大小约是链表节点的两倍,当有足够的节点时,我们才用树节点。当数据量过小时,树节点占更多内存的劣势会抵消其O(logn)的查询优势。
链表使用头插还是尾插?
JDK 1.7 使用头插法。
JDK 1.8 改用尾插法,原因是头插法会改变链表元素原本的顺序,导致并发场景下形成环链表问题。
HashMap类的几个重要属性
loadFactor
: 控制着数组中存放Entry数量的稀疏程度,loadFactor取值在0~1之间(默认0.75),越接近1,数组中的Entry越少,链表越长,查询效率变低。loadFactor 越接近0,Entry越多,链表越短,数组的利用率变低。
threshold
:用来衡量数组是否需要扩容。threshold = capacity * loadFactor