数据结构
JDK1.8之前,HashMap使用的是数组+链表的形式;
JDK1.8以后,HashMap使用的是数组+链表+红黑树的数据结构。
HashMap之所以会使用红黑树有两方面原因:
(1)查询性能。这个比较容易理解,因为链表检索的时间为O(n),而红黑树的检索时间为O(logn);
(2)DOS攻击。HashMap在1.8以前单纯只使用链表,容易被黑客攻击,在同一个hash冲突的数组中放入N个对象,导致构造的这个链表很长,查询时将导致CPU飙升到100%。
算法
重写hashcode
HashMap的源码中,重写了计算hashcode的方法,让高位参与运算使得低位数据尽量不重复,因此采用的是hashcode ^ (hashcode >>>16)。
此处之所以采用的是亦或,主要原因是两个数亦或后低位是0或者1的概率刚好是50%,如下图所示:
计算数组下标
此处HashMap源码使用的是hashcode & (n-1)
(其中n是2的整数次幂)。
正常来说,一般都会使用hashcode%n来计算,为什么此处使用的是这个算法?
在n为2的整数次幂时效果相同,但对于计算机来说与运算只需要算一次。
为什么是整数次幂?
原因主要是因为:整数次幂例如16的二进制为10000,则16-1=15的二进制为01111.那么参加与计算时低四位进行数学运算,最小值为0,最大值为n-1,与求n的模计算结果相同。