1.HashMap的数据结构?
1.1数组&(链表或红黑树 jdk1.8)
发生hash碰撞时会用拉链法形成一个链表,链表长度到达8会转为红黑树(jdk1.8后)
2.HashMap的put 方法是怎么实现的?
/** * Implements Map.put and related methods * * @param hash hash for key * @param key the key * @param value the value to put * @param onlyIfAbsent if true, don't change existing value * @param evict if false, the table is in creation mode. * @return previous value, or null if none */ final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node<K,V>[] tab; Node<K,V> p; int n, i; if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null); else { Node<K,V> e; K k; if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; else if (p instanceof TreeNode) e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else { for (int binCount = 0; ; ++binCount) { if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } } if (e != null) { // existing mapping for key V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; } } ++modCount; if (++size > threshold) resize(); afterNodeInsertion(evict); return null; }
1.根据传入的key值得到一个hashcode值,用这个值的高16位与低16位与得到一个hash值(目的是为了减少哈希碰撞)
2.利用这个hash值和(数组长度-1)做与得到当前这个key在数组中的下标index
3.如果这个index已经存在(即发生哈希碰撞),比较key覆盖值是否相同,如果相同则将这个下标里存的value覆盖,如果key值不同会用拉链法产生一个链表,将该值放在链表根部
4.如果没有发生哈希碰撞,则直接在这个index塞入相应的value
3.HashMap的寻址算法
1.公式:(n-1)&hash
n是HashMap的数组容量大小,hash为key得到的hashcode值的高16位和低16位与
这个公式的目的是为了得到数组中的一个散列下标地址,从取模转变而来,因为计算机对于除法和取模的运算比较慢,在数学上(n-1)&hash和(hash%n)效果相同
2.源码
tab[i = (n - 1) & hash]
4.HashMap的初始化容量有什么要求?为什么?
初始化容量一定是2的指数幂
因为寻址算法(n-1)&hash,n位容量,假设:
n = 32 是 2的指数幂
n-1 = 31 转换为二进制为 0000 0000 0000 0000 0000 0000 0001 1111
hash 0000 0000 0000 0000 0000 0000 000x xxxx
可以看到在(n-1)&hash时0~n-1的所有下标都是可以选择到的
n = 31 不是2的指数幂
n-1 = 30 转换为二进制为 0000 0000 0000 0000 0000 0000 0001 1110
hash 0000 0000 0000 0000 0000 0000 000x xxx0
可以看到(n-1)&hash时0~n-1时有部分下标是选择不到的
所以n的初始化大小必须是2的指数幂,反之会浪费资源
5.HashMap的默认负载因子是0.75,为什么设置为0.75?
1.负载因子设置的越大,HashMap的散列分布的覆盖面越广,但是引起Hash碰撞的几率会比较大,就有可能会转为链表或者红黑树,性能方面会略有下降
2.负载因子设置的值越小,HashMap的散列分布的覆盖面越小,引起Hash碰撞的几率会比较小,取数据就是根据hash值定位下标性能很快,但是会严重浪费内存空间,资源浪费
3.在这个大前提下,在设置负载因子为0.75时,观察各个链表层级数的泊松分布图发现,链表长度为8的几率极小,也就是说很少会出现链表长度为8的情况,jdk1.8后链表长度到8之后会转红黑树,性能也是可以保证的,所以负载因子在0.75是比较好的选择.。