先说明一点,jdk8的HashMap源码把初始化放在了第一次添加元素的方法上,所以当我们构造无参容器实例的时候,是没有初始容量这一码事的.
今天比较无趣,渐渐迷失在了业务逻辑的海洋当中,而真正原始的技艺正在被渐渐遗忘掉.慢慢捡起来,从今天开始.开始慢慢接触源码性质的东西.本人也是菜鸟一枚,欢迎指点…
而且分析的不够全面… 仅仅只是第一次执行这个put方法会执行的流程而已
构造方法
一共四个构造方法.暂时只看第一个无参构造.
/**
* Constructs an empty <tt>HashMap</tt> with the default initial capacity
* (16) and the default load factor (0.75).
*/
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
可以看到,这个无参构造仅仅只是给加载因子赋值了.至于这个loadFactor是什么.emmm就是HashMap扩容的一个临界点的条件.HashMap这个集合需要这个临界点,对是否扩容进行判断.
/**
* The load factor for the hash table.
*
* @serial
*/
final float loadFactor;
/**
* The load factor used when none specified in constructor.
*/
static final float DEFAULT_LOAD_FACTOR = 0.75f;
第一次添加元素.map.put(K,V);
/**
* Associates the specified value with the specified key in this map.
* If the map previously contained a mapping for the key, the old
* value is replaced.
*
* @param key key with which the specified value is to be associated
* @param value value to be associated with the specified key
* @return the previous value associated with <tt>key</tt>, or
* <tt>null</tt> if there was no mapping for <tt>key</tt>.
* (A <tt>null</tt> return can also indicate that the map
* previously associated <tt>null</tt> with <tt>key</tt>.)
*/
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
非常简洁的一行代码.真正的实现是putVal方法.而且还可以看到.put之后,是有返回值的.这个返回值还是有点学问的.
putVal()方法
说这个方法方法之前,先介绍一个静态内部类.它实现了Map.Entry接口.这是一个内部接口…我第一次见.这个类就是Node<K,V>
/**
* Basic hash bin node, used for most entries. (See below for
* TreeNode subclass, and in LinkedHashMap for its Entry subclass.)
*/
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
public final K getKey() { return key; }
public final V getValue() { return value; }
public final String toString() { return key + "=" + value; }
public final int hashCode() {
return Objects.hashCode(key) ^ Objects.hashCode(value);
}
public final V setValue(V newValue) {
V oldValue = value;
value = newValue;
return oldValue;
}
public final boolean equals(Object o) {
if (o == this)
return true;
if (o instanceof Map.Entry) {
Map.Entry<?,?> e = (Map.Entry<?,?>)o;
if (Objects.equals(key, e.getKey()) &&
Objects.equals(value, e.getValue()))
return true;
}
return false;
}
}
很明显的,这个类就是我们的节点类.这个类就是真正存放我们的map值的一个结构.
可以看到属性中,存放了final的hash值,final的k值.和value…在加上一个next属性.这个属性就是一种属于链式的结构了.下一个节点是什么.因为我们知道.当节点从数组上超过8个后,会变形成为红黑树,一种自平衡的二叉树.这个后边说吧…我也不是很懂.
/**
* Implements Map.put and related methods
*
* @param hash hash for key
* @param key the key
* @param value the value to put
* @param onlyIfAbsent if true, don't change existing value
* @param evict if false, the table is in creation mode.
* @return previous value, or null if none
*/
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
// 创建了两个Node,tab和p默认值是null;还定义了两个int型....(这不是废话吗...)n是容器数组容器的长度
Node<K,V>[] tab; Node<K,V> p; int n, i;
/**
*这个地方多说几句.table据说是个桶.实际上是一个Node的数组
* transient Node<K,V>[] table;这是一个临时变量,改天有时间再研究transient修饰的什么意思.
* 这里的这个是使用了一个临时的tab代替table.因为变量在创建对象的时候会被自动初始化.所以这个table是个null.这个涉及到类加载机制里面的一点问题.有时间研究一下.其实是研究过的.回头我在搞一下,然后贴一篇博客出来...本人菜鸟...意见仅供参考QAQ
* 回归真题.第一次调用这个方法,肯定是null的.鉴于||是优化后的,所以,后半部分是不会执行的.
*/
if ((tab = table) == null || (n = tab.length) == 0)
/*
* 这里给n重新赋值了.很明显的n代表的是容器的长度,这里面的resize()方法.研究一下.放到下面了.那先去看一下resize方法
* -----看完了,在下面-----
* resize返回一个16长度大小的新的Node.
*/
n = (tab = resize()).length; //16
if ((p = tab[i = (n - 1) & hash]) == null) // 在这里是个定位.如果用原来要添加的元素,定位出来是一个空的位置.则直接将这个节点放到这个位置.
tab[i] = newNode(hash, key, value, null);
//否则...以后再说.
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;// 这个干啥的?布吉岛.据说是个快速报错机制.他是一个成员变量,也记录了HashMap经过结构修改的次数.
if (++size > threshold) // 如果长度大于了扩容点.那就进行扩容.也就是说我们要天剑第13个元素的时候会进行第二次扩容.
resize();
afterNodeInsertion(evict); // 这个方法...不解.因为是一个空方法,注释说是回调LinkedHashMap的后续操作.
return null; // return null.结束了..不对啊.那第一次添加元素,不就是返回null吗?.这个应该也是一个机制.后面再说.
}
讲真.我看到这部分代码是有点小小的崩溃的.不过,看源码本来就是锻炼内心的.所以还是要坚持看下去的.磨练自己的内心.
可以看到是一个final修饰的方法不可以被继承,返回值是我们的value.
有五个参数.第一个是通过我们的key计算出来的hash值.这个计算方法还是比较复杂的.不在说了.改天有时间单独拿出来一部分时间去研究一下这个hashCode()方法.
第二个是key.第三个是value
第四个是一个条件如果是true,则不要更改现有的值,否则需要更改,上边添加的时候传递的是一个false所以我们需要更改现有的值,至于这个现有的值是什么,那只能往下看了
第五个.如果是false.则表处于创建模式.什么是创建模式.布吉岛啊…尴尬了,上边传递的是true.那就不是创建模式
参数弄完了.注释什么的.直接写在代码里面了.这样比较直观一些.看完这些可以回上边代码里面看一下
resize()方法的部分解释…
/**
* Initializes or doubles table size. If null, allocates in
* accord with initial capacity target held in field threshold.
* Otherwise, because we are using power-of-two expansion, the
* elements from each bin must either stay at same index, or move
* with a power of two offset in the new table.
*
* @return the table
*/
final Node<K,V>[] resize() {
// 顾名思义就是改变容器的大小,将原先的容器.存在oldTab
Node<K,V>[] oldTab = table;
// 得到原始容器的大小
int oldCap = (oldTab == null) ? 0 : oldTab.length;
// 这个threashoud是扩容点.简言之就是达到这个点的容器进行扩容.
// int threshold; 一个成员变量,第一次并没有赋值,所以初始化为0
int oldThr = threshold;
// 这个newCap新容器的大小.newThr 是新的扩容点.
int newCap, newThr = 0;
/*
* 如果oldCap>0.就是容器中存在元素.很明显我们的第一次扩容是不存在>0这种情况的.但是依然不妨碍我们分析一波.
* 假设原来的容器大于0,如果原来的容器长度>=设定好的最大容器长度
*/
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) {
// 将扩容点设置为最大值,意思就是我也不知道QAQ....
threshold = Integer.MAX_VALUE;
return oldTab; // 返回老数组.
}
/*
* 将oldCap左移1位赋值给newCap.如果newCap小于最大容器容量,并且oldCap大于等于默认初始容器容量
* 就让老的扩容点左移1位,赋值给新的扩容点
*/
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
// 老扩容点大于0,就把老扩容点给新容器大小.
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
// 这个才是我们的第一次.正儿八经的第一次.将初始容器大小16给newCap.
// 新的扩容点为加载因子乘以默认容器大小.
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY; // 16
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); // 12
}
// 如果newThr 为0.好吧..看不懂..哈哈.先过.第一次执行这个方法,也不走这里,淡定.
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
// 将新扩容点赋值给成员变量threshold.这个是正儿八经的扩容点
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; // 新建一个新的容器
table = newTab; // 将这新的容器赋值给table.正儿八经的容器.前边的都是临时的.
// 这里面才也能知道是干啥的了.就是将旧容器的内容添加到新的容器里面.
// 下面if里面的先过了.因为.oldtab确实为null
if (oldTab != null) {
// 一波遍历旧容器
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
// 判断去取出来的元素是不是null
if ((e = oldTab[j]) != null) {
// 将老容器改节点置null
oldTab[j] = null;
// 因为Map是后挂式的.所以要判断是不是有下一个节点.
// 如果没有下一个节点.
if (e.next == null)
// 将这个元素重新计算一下位置.这个定位原理就是用hash值 & 容器大小减1.至于为什么这样写.那是因为这样能产生一个很均衡的散列.落点都是非常均匀的.至于这个与原理...下一篇单独列出来.HashMap的数组位置,元素的落点就是根据这个计算弄出来的.
newTab[e.hash & (newCap - 1)] = e;
// 瞅瞅这个treenode...他是一个树节点.这个内部类大概是600行.我就不粘提了.....
// 如果这个实例是TreeNode的
else if (e instanceof TreeNode)
// 调用方法进行拆分.拆分个锤子啊....拆..个锤子.有时间再拆
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
// 返回新的容器
return newTab;
}
突然想用英文写博客了…可惜我英文不好…哈哈.
看方法注释,初始化或者加倍表格的大小.至于为什么是加倍.这个里面有一个叫定位原理的东西.反正意思就是容器的大小一定要是2的n次幂大小.后边在解释.然后如果为null,就初始化为16.就是上边的初始容量.拿过来瞅一眼.
/**
* The default initial capacity - MUST be a power of two.
* 这里有解释,必须是2的指数大小.用的位移...挺牛逼的.
*/
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
好了接着回到resize()方法.