在上一篇文章中,关于Hashmap的初始化和put方法有所了解,发现了其中特别有趣的算法。
今天先来看看他的初始化方法然后看看一些算法:
1,hashMap的初始化方法 主要是用Map去初始化hashMap的这个方法
public HashMap(Map<? extends K, ? extends V> m) {
this.loadFactor = DEFAULT_LOAD_FACTOR;
putMapEntries(m, false);
}
这个方法将默认个加载因子值赋值给加载因子,然后调用这个putMapEntries方法,我们主要分析一下这个函数
final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
int s = m.size(); //首先取得他的size,map的size取得的值都是真正包含的键值对的值,不是内部被使用桶的数量
if (s > 0) { //只有在传递进来的map内部有元素的时候,才进行后续操作
if (table == null) { // pre-size //数组还没有被初始化
float ft = ((float)s / loadFactor) + 1.0F;
//计算在当前的size和加载因子下,对应的数组长度是多少 ,加一是为了下段代码中强转取整;
int t = ((ft < (float)MAXIMUM_CAPACITY) ? //该长度有没有超过最大容量。 如果没有将他转为int类型,会取整。
(int)ft : MAXIMUM_CAPACITY);
if (t > threshold)
threshold = tableSizeFor(t);
//如果该长度大于阈值,那么将t转换为比他大的2的幂次数,如果他本身是则返回原值,下边会专门讲tableSizeFor方法
}
else if (s > threshold) //如果数组已经初始化,并且现在的map.size>阈值,那么进行数组扩充;resize方法会在下文讲解
resize();
for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {//遍历该map 并且put进hashmap中
K key = e.getKey();
V value = e.getValue();
putVal(hash(key), key, value, false, evict);
}
}
}
1,<tableSizeFor() 方法>
具体代码如下:
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
将传入不为2的幂次的capacity转化为大于他并且最接近的2 的幂次数。 例如9 =》16=》2^4;如果本身就是2的幂次,则返回原值;
这个方法的的返回值应该当做这个数组的长度,但是在初始化hashmap的时候,它的返回值是设置给Threshold;
public HashMap(int initialCapacity, float loadFactor) {
....//省略部分源码
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity); //这里tableSizeFor方法的返回值是赋值给threshold,而不是capacity
}
之前不懂为什么要设置给Threshold,部分源码如下。首先在Hashmap源码中没有capacity这个成员变量,他的值不能进行保存,在初始化数组的时候,根据oldThreshold是否大于0,进行判断。将threshold的值赋值给capacity.然后根据capacity的大小初始化数组,如果一开始将返回值赋值给capacity,那么在以下代码中判断oldCap>0的时候就不止是需要进行扩充。还需要初始化数组。
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
...
}
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
第二个方法,是在数组reSize的时候进行rehash;
我们知道hashmap的数据结构是数组+链表/红黑树,我们希望她在存放数据的时候,存放聚云,最理想的就是数组中的每个位 置上只有一个元素,这样查询的时候效率最高,不需要遍历,也不用通过equals去比较k,而且空间的利用率最大,分布最均匀。而在数组扩充容量之后,需要对之前数组中链表的节点进行重排。
扩充前原数组 长度为16
扩充后 长度为32 ,但是实现了重分布,是整个hashmap分布得更加均匀,简化查找过程,提高查找效率