HashMap是Map接口的一种实现。
HashMap的存储形式是Node数组,其中Node是HashMap实现的内部类,它用来存储key和value,以及节点指向的下一个元素。
通过这种形式,就构成了我们常说的数组+链表的形式。
HashMap的存放数据的过程比较有趣,它总体设计是通过hashCode来计算出当前key和value在数组中的位置,再根据这个位置是否有元素来决定是覆盖还是通过尾插法插入链表尾部。
对于一个key-value的插入,并非只需要取hashcode这么简单,它的过程分为以下几步:
1.取key.hashCode与key.hashCode>>>16使得高16位与低16位做异或运算,得到结果hashResult;
2.将异或运算的结果与node数组的长度-1进行与运算;这相当于取模运算hashResult%(table.length-1),得到这个key在node数组的位置index;
3.判断index位置是否为null,若为空直接赋值,若不为空需要从头到尾遍历整个链表,通过Object.equals来判断key是否与链表上的节点相等,若相等则覆盖,若都不相等就通过尾插法来插入这个键值对。
4.插入完成判断一次链表长度,若超过8就转成红黑树来增加遍历效率。
之所以1中要把高低16位互相异或运算,是为了避免低16位冲突太多,异或后可以使得低位保留到高位的信息,减少hash冲突。
2中使用这种与运算方式就决定了hashMap的扩容必须是2的幂。
3中为了解决hash冲突必须使用equals方法,所以决定了作为key的对象必须重写hashCode和equals方法。
3中用尾插法是为了防止多线程情况下A线程在扩容,B线程在插入数据时,头插法会导致循环链表的情况出现。