ArrayList、LinkedList、HashMap相关面试题
ArrayList
1.ArrayList的扩容机制
- 扩容是懒惰式的,即没有添加元素前,即使指定了容量,也不会真正创建数组
- add(Objecto)首次扩容为10,再次扩容为上次容量的1.5倍
- addAll(Collection c)首次扩容为Math.max(10,实际元素个数)
- addAl(Collectionc)再次扩容(有元素时)为Math.max(原容量1.5倍,实际元素个数)
2.Iterator的fail-fast、fail-safe机制
- ArrayList是fail-fast的典型代表,遍历的同时不能修改,尽快失败
- CopyOnWriteArrayList 是fail-safe的典型代表,遍历的同时可以修改,原理是读写分离
LinkedList
1.掌握ArrayList与LinkedList的区别
- ArrayList
1.基于数组,需要连续内存
2.随机访问快( 指根据下标访问)
3.尾部插入、删除性能可以,其它部分插入、删除都会移动数据,因此性能会低
4.可以利用cpu缓存,局部性原理 - LinkedList
1.基于双向链表, 无需连续内存
2.随机访问慢(要沿着链表遍历)
3.头尾插入删除性能高
4.占用内存多
HashMap
1.底层数据结构,1.7,1.8有何不同
- 1.7:数组+链表
- 1.8:数组+(链表 | 红黑树)
2.为何要使用红黑树,为何一上来不树化,树化阈值为何是8,何时会树化,何时会退化为链表
- 红黑树用来避免Dos攻击,防止链表超长时性能下降,树化 应当是偶然情况
- hash 表的查找,更新的时间复杂度是0(1),而红黑树的查找,更新的时间复杂度是0(log2 n), TreeNode占用空间也比普通Node的大,如非必要,尽量还是使用链表
- hash 值如果足够随机,则在hash表内按泊松分布,在负载因子0.75的情况下,长度超过8的链表出现概率是0.00000006,选择8就是为了让树化几率足够小
- 树化的两个条件:链表长度是否超过树化阈值 & 数组容量>=64( 数组容量为大于64 首先考虑扩容 )
- 退化情况:
a.在扩容时拆分树时树的元素<=6时则会退化为链表
b.remove树节点时,若root、root.left、root.right、root.left.left有一个为null,则会退化为链表
3.索引如何计算,hashCode都有了,为何还要提供hash()方法?数组容量为何是2的n次幂?
-
计算对象的 hashCode(),再进行调用HashMap的hash() 方法进行二次哈希,最后& (capacity - 1)得到索引
-
二次 hash()是为了综合高位数据,让哈希分布更为均匀
-
计算索引时, 如果是2的n次幂可以使用位与运算代替取模,效率更高;扩容时hash & oldCap == 0的元素留在原来位置,否则新位置=旧位置+ oldCap
-
但①、②、③都是为了配合容量为2的n次幂时的优化手段,例如Hashtable的容量就不是2的n次幂,并不能说哪种设计更优,应该是设计者综合了各种因素,最终选择了使用2的n次幂作为容量
4.介绍一下put方法流程,1.7和1.8有何不同
- put方法流程
-
HashMap是懒惰创建数组的,首次使用才创建数组
-
计算索引(桶下标)
-
如果桶下标还没人 占用,创建Node占位返回
-
如果桶下标已经有人占用
①已经是 TreeNode走红黑树的添加或更新逻辑
②是普通Node,走链表的添加或更新逻辑,如果链表长度超过树化阈值,走树化逻辑 -
返回前检查容量是否超过阈值,-旦超过进行扩容
- 不同
1.链表插入节点时,1.7是头插法,1.8是尾插法
2.1.7是大于等于阈值且没有空位时才扩容,而1.8是大于阈值就扩容
3.1.8在扩 容计算Node索引时,会优化
5.加载因子为何默认是0.75f?
①在空间占用与查询时间之间取得较好的权衡
②大于这个值,空间节省了,但链表就会比较长影响性能
③小于这个值,冲突减少了,但扩容就会更频繁,空间占用多
6.多线程下会有啥问题?
①扩容死链 (1.7)
②数据错乱(1.7, 1.8)
7.key能否为null,作为key的对象有什么要求?
①HashMap的key可以为null,但Map的其他实现则不然
②作为key的对象,必须实现hashCode和equals, 并且key的内容不能修改(不可变)