当key为null时,这次put操作,数据将被放入那个桶位?为什么?
当key等于空时,hash返回的是0,通过p = tab[i = (n - 1) & hash]得出i为0,所以放在0号桶位
JDK1.8的HashMap为什么要引入红黑树,以及树化的条件
当HashMap中的数据量足够多的时候,HashMap的链化会很严重,他的查找效率会非常低,而引入红黑树,就是为了提高查找效率的。
当桶内元素超过64个并且某个链表的长度大于等于8的时候会进行树化。
为什么默认的加载因子loadFactor为0.75
加载因子过高,例如为1,虽然减少了空间开销(扩容次数减少),提高了空间利用率,但同时也增加了查询时间成本(导致链表变长);加载因子过低,例如0.5,虽然可以减少查询时间成本,但是空间利用率很低。
谈一下hashMap中什么时候需要进行扩容,扩容resize()又是如何实现的?
当table中的元素达到阈值的时候(cap * loadFactor)就会进行扩容,数组长度上线为2的30次幂(位运算是1<<30)。
1、如果oldCap大于等于最大容量,那么返回oldCap,不扩容
2、如果oldCap * 2 < 最大容量,并且oldCap 大于等于默认初始容量16,则扩容为oladCap的2倍
3、如果还未初始化,就将oldThr赋给newCap这个oldThr一定是2的n次方,然后计算出一个新的newThr赋给loadFactor,newThr = newCap * loadFactor
4、遍历oldTab
5、如果当前桶位只有一个元素,从未发生过碰撞,直接算出当前元素在新数组中存放
的位置,然后放进去。如果是链表,那么就将之前的链表进行拆分到新的数组中。如果已经树化,就进行树的操作(目前不太了解红黑树的底层)。
ConcurrentHashMap的put
做插入操作时,首先进入乐观锁一个while循环,然后,在乐观锁中判断容器是否初始化,如果没初始化则初始化容器,如果已经初始化,接下来通过key的hash值来判断table中是否存在相同的key,如果不存在,执行casTabAt()方法。如果该节点不为空,再判断容器是否在扩容中,如果在扩容,则帮助其扩容。如果没有扩容,则进行最后一步,先加锁,然后找到hash值相同的那个节点(hash冲突),循环判断这个节点上的链表,决定做覆盖操作还是插入操作。循环结束,插入完毕。
ConcurrentHashMap的get
ConcurrentHashMap的get操作并没有像put操作一样有CAS和synchronized锁。get操作不需要加锁,因为 Node 的元素 value 和指针 next 是用 volatile 修饰的,所以在多线程的环境下,即便value的值被修改了,在线程之间也是可见的
第一:使用volatile关键字会强制将修改的值立即写入主存;
第二:使用volatile关键字的话,当线程2进行修改时,会导致线程1的工作内存中缓存变量的缓存行无效(反映到硬件层的话,就是CPU的L1或者L2缓存中对应的缓存行无效)
第三:由于线程1的工作内存中缓存变量的缓存行无效,所以线程1再次读取变量的值时会去主存读取。
为什么HashMap内部的散列表数组的长度一定是2的次方数
HashMap的数组长度一定保持2的次幂,比如16的二进制表示为 10000,那么length-1就是15,二进制为01111,同理扩容后的数组长度为32,二进制表示为100000,length-1为31,二进制表示为011111。从下图可以我们也能看到这样会保证低位全为1,而扩容后只有一位差异,也就是多出了最左位的1,这样在通过 h&(length-1)的时候,只要h对应的最左边的那一个差异位为0,就能保证得到的新的数组索引和老数组索引一致(大大减少了之前已经散列良好的老数组的数据位置重新调换),这也是为啥数组长度必须是2的幂次原因之一。
另外,数组长度必须是2的幂次的另一原因就是能保证数据分布的均匀性。
面向对象的设计模式有七大基本原则
开闭原则(首要原则): 要对扩展开放,对修改关闭
单一职责原则: 实现类要职责单一
里氏代换原则: 不要破坏继承体系
依赖倒转原则: 面向接口编程
接口隔离原则: 设计接口要精简单一
合成/聚合复用原则: 尽量先使用组合或者聚合来实现,其次才考虑使用继承关系来实现
最少知识原则或者迪米特法则: 降低耦合