1、put方法
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
//hash就是key的hash值,根据这个hash得出数据存放再数组中的位置,onlyIfAbsent为true时,不存在key才会执行put操作。
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0) // 初始化是一个空的Node数组
n = (tab = resize()).length; // 扩容方法,初始化扩容默认容量为16
if ((p = tab[i = (n - 1) & hash]) == null) //如果数组索引处为null
tab[i] = newNode(hash, key, value, null); //就把key-value构造一个Node数组插入数组中
else {
Node<K,V> e; K k;
if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) //如果hash和key都相等
e = p;
else if (p instanceof TreeNode) //如果是红黑树结构
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null); // 把新的Node节点插入链表的尾部(尾插法,1.8之前是头插入)
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st //如果链表长度大于等于8,转换为红黑树
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k)))) //已经插入完成,直接退出循环
break;
p = e;
}
}
if (e != null) { // existing mapping for key,如果存在对应的key值,直接进行更新操作
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null) // onlyIfAbsent为false,就更新
e.value = value;
afterNodeAccess(e);
return oldValue; //返回旧值
}
}
++modCount; //修改记录值
if (++size > threshold) //size大于负载因子要求的容量值就进行扩容
resize();
afterNodeInsertion(evict);
return null;
}
put方法如上所示,如果是一个初始化空的集合,put第一个键值对时,就会对Node数组初始化赋值,默认的容量16,有一个onlyIfAsent的参数,为true时,如果集合存在对应的Key值,不进行更新操作,如果为false,就更新对应key的value值。
插入键值对时,如果数组中对应hash的位置存在数据,要判断是红黑树结构还是链表结构,如果是红黑树结构,就把Node节点加入树中,并调整树节点。如果是链表结构,直接加入链表的尾部。当链表长度大于等于8时,要转换为红黑树结构。插入数据后对集合数据的size进行判断,大于负载因子*总容量时要进行扩容操作。
第9行中:p = tab[i = (n - 1) & hash]中,(n-1)&hash就是计算键值对在Node数组中的位置。只有hash的后几位数值起到了作用,具体可参考Java从入门到放弃(十)集合框架之HashMap源码(1)
1.8之前是头插入法,即插入的Node节点是在链表的头部,这是因为考虑到LRU,即最新插入的数据最有可能倍用到,1.8以后改为了尾插入,据说是为了更好的resize操作,因为1.7的扩容计算更多而且多线程下有可能会出现死循环的问题。
2、hash方法
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
hash方法是HashMap中用于计算键值对在Node数组中位置的重要方法。这里是一个很简单也很巧妙的计算,如果key是null值,直接返回0,由此可以看出key为null的键值对存储在Node的0位置上。计算是直接把hash的高16位和低16位进行异或运算(int总共32位)。其实这个算法最主要是使得数据尽可能的均匀分布,所以要减少碰撞。因为异或运算中,一个数异或0都得出自身,所以能尽量减少hashcode方法返回不同的值但是在用(n-1)&hash计算得出同样的结果的情况。上面是1.8以后的hash方法,1.7的hash方法如下,
final int More ...hash(Object k) {
int h = hashSeed;
if (0 != h && k instanceof String) {
return sun.misc.Hashing.stringHash32((String) k);
}
h ^= k.hashCode();
h ^= (h >>> 20) ^ (h >>> 12);
return h ^ (h >>> 7) ^ (h >>> 4);
}
求出hashcode后,进行了很多次右移和异或运算,具体可以自己去画出对应的二进制运算图,其实就是尽量的让每一位数值都参与到运算中,这样子就能减少hash碰撞的发生。
3、扩容resize
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table; //旧的Node数组
int oldCap = (oldTab == null) ? 0 : oldTab.length; //旧的容量
int oldThr = threshold; //旧的最大的size值
int newCap, newThr = 0;
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) { //如果大于等于最大容量值就无法进行扩容
threshold = Integer.MAX_VALUE;
return oldTab;
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&oldCap >= DEFAULT_INITIAL_CAPACITY) //扩容是使容量加倍
newThr = oldThr << 1; // double threshold
}
else if (oldThr > 0) // initial capacity was placed in threshold //初始化的空的数组
newCap = oldThr;
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY; //初始化一些默认的参数
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
float ft = (float)newCap * loadFactor; //计算新的最大size值
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e; //如果该位置只有一个Node节点,重新计算位置插入
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap); //红黑树重新构建
else { // preserve order
Node<K,V> loHead = null, loTail = null; //loHead是头节点,loTail是现在的节点,
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next; //把原链表元素遍历
if ((e.hash & oldCap) == 0) { //如果计算为0,就存入loHead为头节点的链表中
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else { //存入以hiHead为头节点的链表中
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead; //loHead链表直接插入新数组的j位置
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead; //hiHead链表直接插入新数组的j+oldCap位置
}
}
}
}
}
return newTab;
}
扩容操作:如果是新的初始化的集合,就设置一些默认的参数为容量。否则就把容量扩大为原来的2倍,重新生成一个2*oldCap的数组,然后对oldTable的Node数组进行循环遍历重新插入新的数组,如果只有一个元素,直接重新计算位置执行插入。如果是红黑树,执行对应的函数,这里不做研究。如果是链表结构,因为数组的位置是hash&(cap-1)计算出来的,如cap是变成2*cap,对应二进制来说就是(cap-1)就是多了一个1,例如:oldcap是2^6,二进制oldcap-1就是111111,那么新的(2*oldcap-1)就是1111111,hash&(newcap-1)开头就要多一位0或者1,如果是0,结果就是一样的。在数组中所有是不变的,如果是1,就是相当于多加了一个oldCap的值,所以链表中的Node节点,要么在j索引(原先的位置)处,要么在j+oldCap处
在1.7以及之前是直接对每一个Node节点进行重新计算插入的,更耗性能。
4、get方法
public V get(Object key) {
Node<K,V> e;
return (e = getNode(hash(key), key)) == null ? null : e.value; //没有对应返回null,有就返回value值
}
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
if ((tab = table) != null && (n = tab.length) > 0 &&(first = tab[(n - 1) & hash]) != null) { //如果对应hash的位置有数据
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k)))) //如果first节点的key和查询的key相等,直接返回first节点
return first;
if ((e = first.next) != null) {
if (first instanceof TreeNode) //红黑树结构
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k)))) //遍历链表,查询到对应的key的Node节点
return e;
} while ((e = e.next) != null);
}
}
return null;
}
get方法比较简单一点,就是根据key值的hash值在Node数组中查找对应的位置,在对应位置中的节点、红黑树或者链表中知道对应的key值的Node的节点。找到就返回对应的value值,没有就直接返回null。