HashMap一些内部原理

1.HashMap的数据结构?

1.1数组&(链表或红黑树 jdk1.8)

   发生hash碰撞时会用拉链法形成一个链表,链表长度到达8会转为红黑树(jdk1.8后)

2.HashMap的put 方法是怎么实现的?

/**
 * Implements Map.put and related methods
 *
 * @param hash hash for key
 * @param key the key
 * @param value the value to put
 * @param onlyIfAbsent if true, don't change existing value
 * @param evict if false, the table is in creation mode.
 * @return previous value, or null if none
 */
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        Node<K,V> e; K k;
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

1.根据传入的key值得到一个hashcode值,用这个值的高16位与低16位与得到一个hash值(目的是为了减少哈希碰撞)

2.利用这个hash值和(数组长度-1)做与得到当前这个key在数组中的下标index

3.如果这个index已经存在(即发生哈希碰撞),比较key覆盖值是否相同,如果相同则将这个下标里存的value覆盖,如果key值不同会用拉链法产生一个链表,将该值放在链表根部

4.如果没有发生哈希碰撞,则直接在这个index塞入相应的value

3.HashMap的寻址算法

 1.公式:(n-1)&hash

  n是HashMap的数组容量大小,hash为key得到的hashcode值的高16位和低16位与

  这个公式的目的是为了得到数组中的一个散列下标地址,从取模转变而来,因为计算机对于除法和取模的运算比较慢,在数学上(n-1)&hash和(hash%n)效果相同

  2.源码

   tab[i = (n - 1) & hash]

4.HashMap的初始化容量有什么要求?为什么?

  初始化容量一定是2的指数幂

  因为寻址算法(n-1)&hash,n位容量,假设:

  n = 32 是 2的指数幂

  n-1 = 31 转换为二进制为 0000 0000 0000 0000 0000 0000 0001 1111

  hash                                 0000 0000 0000 0000 0000 0000 000x xxxx

 可以看到在(n-1)&hash时0~n-1的所有下标都是可以选择到的

  n = 31 不是2的指数幂

  n-1 = 30 转换为二进制为 0000 0000 0000 0000 0000 0000 0001 1110

  hash                                 0000 0000 0000 0000 0000 0000 000x xxx0

 可以看到(n-1)&hash时0~n-1时有部分下标是选择不到的

  所以n的初始化大小必须是2的指数幂,反之会浪费资源

5.HashMap的默认负载因子是0.75,为什么设置为0.75?

  1.负载因子设置的越大,HashMap的散列分布的覆盖面越广,但是引起Hash碰撞的几率会比较大,就有可能会转为链表或者红黑树,性能方面会略有下降

  2.负载因子设置的值越小,HashMap的散列分布的覆盖面越小,引起Hash碰撞的几率会比较小,取数据就是根据hash值定位下标性能很快,但是会严重浪费内存空间,资源浪费

  3.在这个大前提下,在设置负载因子为0.75时,观察各个链表层级数的泊松分布图发现,链表长度为8的几率极小,也就是说很少会出现链表长度为8的情况,jdk1.8后链表长度到8之后会转红黑树,性能也是可以保证的,所以负载因子在0.75是比较好的选择.。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值