Java并发---HashMap的奇怪知识点

1、hashmap初始化的容量会发生变化吗?

注意:这里用的是1.7的jdk。

public static void main(String[] args) {
    Map map = new HashMap(11);
    map.put("sss",111);
}

问题:在上面的代码中,我们初始化了一个Hashmap的初始化容量是11,可是它的容量真的是11吗?
答复:答案是不是的,请看下面源码分析:
当我们点击put方法时,发现代码是这样子的

public V put(K key, V value) {
	// 这里判断map是否为空,如果为空,则初始化map,走下面代码
    if (table == EMPTY_TABLE) {
        inflateTable(threshold);
    }
    if (key == null)
        return putForNullKey(value);
    // 计算hash散列值
    int hash = hash(key);
    int i = indexFor(hash, table.length);
    // 处理hash冲突
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }

    modCount++;
    // 扩容并转移数据,在里面的resize方法的transfer方法
    addEntry(hash, key, value, i);
    return null;
}
private void inflateTable(int toSize) {
    // Find a power of 2 >= toSize
    // roundUpToPowerOf2 方法会将一个数值强行转化为2的n次幂
    // 1、必须最接近size
    // 2、必须 >= size
    // 3、必须是2的n次幂
    // 所以上面传入的是11的话,转化后就是16,如果是17的话,转化后就是32
    int capacity = roundUpToPowerOf2(toSize);
    threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
    table = new Entry[capacity];
    // 这里就是初始化hashcode
    initHashSeedAsNeeded(capacity);
}

综上代码分析,我们发现即使我们传入的不是2的n次幂,hashmap也会自动给我们转化为2的n次幂。

2、hashmap初始化的容量为什么会发生变化?

因为当一个数字是2的n次幂时,会有如下代码效果。

// x 为任意数
int a = x % 2^n;
int b = x & ( 2^n - 1 );

上面的代码中a和b的结果都是一样的,但是b的运算速度比a要快的多,所以,会把我们的容量转化为2的n次幂(2n)。

3、jdk7的hashmap扩容死锁问题。

在haspmap扩容时,由于在put方法解决hash冲突采用的是头插法,所以在扩容时,如果之前数组产生过hash冲突的几个数据在rehash之后放到新数组中仍然产生hash冲突,那么就会把数据翻过来,如果是多线程的话,就会产生闭环,出现死锁。
产生问题的原因:rehash之后用了头插法就产生了这种问题。
复制数据源码如下:

void transfer(Entry[] newTable, boolean rehash) {
    int newCapacity = newTable.length;
    for (Entry<K,V> e : table) {
        while(null != e) {
            Entry<K,V> next = e.next;
            if (rehash) {
                e.hash = null == e.key ? 0 : hash(e.key);
            }
            int i = indexFor(e.hash, newCapacity);
            // 就是下面这几行代码导致了链表的反转
            e.next = newTable[i];
            newTable[i] = e;
            e = next;
        }
    }
}

4、为什么hashmap的扩展因子是0.75?

1、如果是0.5的话,将会是一种空间换时间的方法,就是说如果我们的空间有4G,那么就只能用2G,这样子显然有点浪费。
2、如果是1的话,会产生大量的冲突。
0.75的由来:其实这个扩展因子的考虑点就在于减少我们的hash冲突,这个数据取决于一个公式,叫牛顿二项式,其实当时算出来的数据是0.693,而每个语言的取值都不相同,java的hashmap取值为0.75,可能就是一种空间与时间效率的折中吧。

5、jdk8的hashmap数组与红黑树转换。

注意:这里用的是1.8的jdk。

jdk8的hashmap数组与红黑树的转换规则:
条件成立:当hashmap容量大于等于 64 时,并且一个位桶数组上的长度大于8时,才会将链表转换为红黑树。
条件不成立:如果只有链表长度大于8,而容量小于64时,是优先扩容的。
源码如下:

final void treeifyBin(Node<K,V>[] tab, int hash) {
    int n, index; Node<K,V> e;
    // MIN_TREEIFY_CAPACITY 的值为64
    if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
    	// 条件不成立,扩容
        resize();
    else if ((e = tab[index = (n - 1) & hash]) != null) {
    	// 条件成立,链表转红黑树
        TreeNode<K,V> hd = null, tl = null;
        do {
            TreeNode<K,V> p = replacementTreeNode(e, null);
            if (tl == null)
                hd = p;
            else {
                p.prev = tl;
                tl.next = p;
            }
            tl = p;
        } while ((e = e.next) != null);
        if ((tab[index] = hd) != null)
            hd.treeify(tab);
    }
}

6、jdk8如何解决jdk7扩容死锁问题。

先看一下jdk8的扩容代码:
在hashMap类的resize()方法

Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
    next = e.next;
    // 与我们的容量取 & 运算,比如说容量是16 ,则只会得出结果为16 或者 0
    if ((e.hash & oldCap) == 0) {
        if (loTail == null)
            loHead = e;
        else
            loTail.next = e;
        loTail = e;
    }
    else {
        if (hiTail == null)
            hiHead = e;
        else
            hiTail.next = e;
        hiTail = e;
    }
} while ((e = next) != null);
// 低位的话直接挪到新数组相同的槽位下
if (loTail != null) {
    loTail.next = null;
    newTab[j] = loHead;
}
// 高位数组会放在槽位数值加上旧的数组容量(也就是16)的新数组槽位下
if (hiTail != null) {
    hiTail.next = null;
    newTab[j + oldCap] = hiHead;
}

这里的代码比较复杂,我在这块就简单介绍一下大概的逻辑
首先这段代码去掉了rehash,并且定义了四个指针 loHead ,loTail ,hiHead ,hiTail 。
代码中也可以看到会去做 & 运算,结果会产生高低位,16 算高位,0 算低位,将会把一条链表分为两条链表,低位的话直接挪到新数组相同的槽位下,高位数组会放在槽位数值加上旧的数组容量(也就是16)的新数组槽位下,这样就避免了头插法形成的闭环,在代码中看注释这就话就很容易理解了。
这是数学的推理,记住结论即可,当然数组的容量必须是2的n次幂。

7、hashmap为什么在链表长度大于8的时候才转红黑树?

问题:为什么这个阈值是8,而不是其它数字,有什么区别吗?
答:如果仔细看HashMap源码时就会发现在负载因子为0.75时,hashMap采用泊松分布算法,算出每个槽位在链表各个长度时,有数据落到该槽位的概率,为8的时候概率已经很小了,所以 取了8这个阈值,如下图所示:

在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值