title: 也谈HashMap实现原理
date: 2019-02-17 14:20:53
tags:
HashMap在互联网应用中是一个老生常谈的话题。从redis等各类缓存到spring内部BeanDefinition的存储,都能看到HashMap的身影。可见hashMap这个数据结构的重要性。
最近也在重看HashMap的结构,记录一下,希望能有一些启发。
不同版本的JDK,HashMap的实现略有不同,以下是JDK1.8版本的HashMap。
用intelliJ打开HashMap源码,打开Structure视图,可以看到HashMap主体存储结构是
/**
* The table, initialized on first use, and resized as
* necessary. When allocated, length is always a power of two.
* (We also tolerate length zero in some operations to allow
* bootstrapping mechanics that are currently not needed.)
*/
transient Node<K,V>[] table;
Node是HashMap的一个静态内部类,以下是Node结构的定义
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
Node结构中的next字段指向的是下一个Node节点,所以简单来说,HashMap是一个桶型的结构,如图
其中,数组是基本结构,数组中存储的是链表。
而HashMap的查找顺序是首先按照hash值,找到数组中的链表,然后遍历这个链表,通过key对象的equals方法逐一进行比对。
再来看一下主要的几个字段
final float loadFactor; //table的负载因子,负载因子越高,table的填充率越高
static final float DEFAULT_LOAD_FACTOR = 0.75f; //table负载因子默认是0.75
transient int size; //map中的k-v键值对数量
int threshold; //容纳k-v对的极限,如果超过这个值,就会扩容
看主要的初始化方法
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
}
可以看到,这里并没有对table分配内存空间,分配的内存操作放在put方法中,这里要注意tableSizeFor(initialCapacity)这个方法,源码如下:
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
可以看到,这里用了一个位运算,无符号右移,最终的作用就是输出不小于cap的首个2的n次幂,作为table的初始大小。
至于为什么HashMap的数组长度要用2的n次幂,这个后面会有讲解。
未完待续…