HashMap的内部结构
最关键的是容器,该容器是个Node 类的数组
transient Node<K,V>[] table;
Node 代码
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
//关键的next指向后续node,
//node.next->node.next->node.next->null 整个变成一条链
Node<K,V> next;
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
。。。。。。
}
最常用的是HashMap的put方法,一个key ,一个value。要做的就是怎么把key:value组成的node
public V put(K key, V value) {
//hash(key)将key的值做一个算法得出hash值
//实际上是将key的hashcode来做一些运算
return putVal(hash(key), key, value, false, true);
}
hash(key)方法
static final int hash(Object key) {
int h;
//hashcode的高位 和 hashcode 异或运算
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
putVal方法
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//table就是容器,如果table 为空就去resize()
if ((tab = table) == null || (n = tab.length) == 0)
//resize就是对table做初始化或调整大小,确保容器能够容纳或高效率
n = (tab = resize()).length;
//如果 (n - 1) & hash 得到得数组下标的node为null
//为什么这里通过(n - 1) & hash算出下标?
if ((p = tab[i = (n - 1) & hash]) == null)
//直接new出一个node放进去
tab[i] = newNode(hash, key, value, null);
else {
//如果得到得数组下标的node已经存在
Node<K,V> e; K k;
//比较已经存在的node的hash和传入的key的hash,如果相等再==,equals比较key,如果是相等则认为是替换该node,
//note : 如果对象的hash值相等不能认为同一个对象,还需要equals比较
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//如果不是替换该node,则找node 的后续链node
for (int binCount = 0; ; ++binCount) {
//后续链node为null,直接就放后面
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
//如果后续链node不为null,则比对hash值,hash值相等则比对key值,不等的话继续循环,相等跳出,后面做替换
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//已经存在的node ,则做替换node里的value
if (e != null) {
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
//替换操作的话返回旧值
//旧值有可能是null
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
//不是替换操作返回null
return null;
}
上面的代码里的问题为什么通过(n - 1) & hash算出下标?参考 http://blog.csdn.net/huzhigenlaohu/article/details/51802457
简单的来说就是hashmap的容器的长度必须是2的n次方,这样做的目的是容器长度-1(上面的n-1)后的值按0,1表示会是
…0000 1111 (2^4 - 1)
…0001 1111 (2^5 - 1)
…0011 1111 (2^6 - 1)
(n - 1) & hash 就有机会获取到0 到 n-1 之间的值
上面代码里的resize(),一度看不明白这段代码是什么意思,后来看了http://www.importnew.com/20386.html才明白,感谢这位作者,有兴趣的读者可以看下这篇blog 里的3. 扩容机制
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
else {//oldThr==0 第一次进来,使用默认的容量16,阈值16*0.75=12
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
//如果旧的table不为空
if (oldTab != null) {
//遍历旧的table
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
//对table里不为空的节点
if ((e = oldTab[j]) != null) {
//将节点赋给e这个变量,再将旧的节点制空
oldTab[j] = null;
//该节点只有一个,没有后续节点组成链表,很简单找出新数组的下标放入
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else {
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
//旧的table里的node位置(数组下标)放到新扩展的table里只有可能2个位置,1个是相同,
//另个原位置+旧数组的长度 (e.hash & oldCap)==0就是还是旧的位置(低位),否则就是新位置(高位),
//下面的代码是遍历组成2条链,高位链和低位链
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
//放入低位链
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
//放入高位链
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}