List
① Vector
底层:数组
线程安全。原因:方法上加了synchronized,因此效率比较低。
Vector 扩容2倍
② ArrayList
1.Iterator - FailFast-FailSafe知道吗?
- fail-fast: 一旦发现遍历的同时有其他人在修改,则立即抛出异常
- fail-safe: 发现遍历的同时有其他人来修改,应当能有应对策略,例如牺牲一致性来让整个遍历运行完成。
ArrayList 对应的就是fail-fast ,CopyOnWriteArrayList 对应的就是fail-safe。
2.ArrayList和LinkedList比较
ArrayList
①. 基于数组
,需要连续内存
②. 随机访问快(指根据下标访问)
③. 尾部插入、删除性能可以
,其他部分插入、删除都会移动数据,因此性能会低
④. 可以利用cup缓存
,局部性原理
LinkedList
①. 基于双向链表
,无需连续内存
②. 随机访问慢(要沿着链表遍历)
③. 头尾插入性能高
④. 占用内存多
通过两者中间插入
的结果对比:
很明显ArrayList的插入效率更高一些。
所以在开发上基本上用ArrayList比较多,除非是需求是通过头部去插入的。
③ LinkedList
底层:双向链表
④ CopyOnWriteArrayList
Map
① HashTable
底层实现?
数组+链表
它是线程安全的,为什么线程安全呢?底层使用了Synchronized同步方法
1.Hashtable vs ConcurrentHashMap
- Hashtable 与 ConcurrentHashMap 都是线程安全的Map集合
- Hashtable 并发度低,整个Hashtable 对应一把锁,同一时刻,只能有一个线程操作它
- 1.8之前ConcurrentHashMap 将数组的每一个头节点做为锁,如果多个线程访问的头结点不同,则不会冲突
② HashMap
1.底层数据结构,1.7和1.8有什么不同?
- 1.7数组+链表,1.8 数组+(链表|红黑树)
2.为何要用红黑树,为何一上来不树化,树的阈值为何是8,何时会树化,何时会退化为链表?
-
① 红黑树用来
避免Dos攻击
,防止链表超长时性能下降,树化应当是偶然情况
1. hash表的查找,更新的时间复杂度是0(1),而红黑树的查找,更新的时间复杂度是0(log2 n),TreeNode占用空间也比普通的Node的大,如非必要,尽量还是使用链表。
2. hash值如果足够随机,则在hash表内按泊松分布,在负载因子0.75的情况下,长度超过8的链表出现概率是0.00000006,选择8就是为了让树化几率足够小。 -
② 树化两个条件:
链表长度超过树化阈值8
;数组容量>=64
-
③ 退化情况1:在扩容时如果拆分树时,
树元素个数<=6则会退化链表
-
④ 退化情况2:remove树节点时,如果在移除之前,若root、root.left、root.right、root.left.left有一个为null,也会退化为链表。
3.索引如何计算?hashCode都有了,为何还要提供hash()方法?数组容量为何是2的n次幂?
- ① 计算对象的hashCode(),再进行调用HashMap的hash() 方法进行二次哈希,最后
&(capacity-1)
得到索引 - ② 二次hash()是为了综合高位数据,
让哈希分布更为均匀
- ③ 计算索引时,如果是2的n次幂可以使用位运算代替取模,
效率更高
;扩容时hash&oldCap==0的元素留在原来位置,否则新位置=旧位置+oldCap - ④ 但 ① 、②、 ③都是为了配合容量为2的n次幂时的优化手段,例如Hashtable的容量就不是2的n次幂,并不能说那种设计更优,应该是设计者综合了各种因素,最终选择了使用2的n次幂作为容量
4.介绍一下put方法流程,1.7与1.8有何不同?
- ① HashMap是懒惰创建数组的,首次使用才创建数组
- ② 计算索引(桶下标)
- ③ 如果桶下标还没人占用,创建Node占位返回
- ④ 如果桶下标已经有人占用
- 已经是TreeNode走红黑树的添加或更新逻辑
- 是普通Node,走链表的添加或更新逻辑,如果链表长度超过树化阈值,走树逻辑
- ⑤ 返回前检查容量是否超过阈值,一旦超过进行扩容
- ⑥ 不同
- 链表插入节点时,
1.7是头插法
,1.8是尾插法
- 1.7是大于等于阈值且没有空位时才扩容,而1.8是大于阈值就扩容
- 1.8在扩容计算Node索引时,会优化
- 链表插入节点时,
5.加载因子为何默认是0.75f?
- ① 在
空间占用与查询时间
之间较好的权衡 - ② 大于这个值,空间节省了,但链表就会比较长影响性能
- ③ 小于这个值,冲突减少了,但扩容就会更频繁,空间占用多
6.多线程下会有啥问题?
- ① 扩容死链(1.7)
- ② 数据错乱 (1.7,1.8)
7.key能否为null,作为key的对象有什么要求?
- ① HashMap的key可以为null,但Map的其他实现则不然
- ② 作为key的对象,必须实现hashCode和equals,并且key的内容不能修改为(不可变)
8.String对象的hashCode()如何设计的,为啥每次乘的是31?
- 通过测试,31的hash碰撞概率比较小
- 31方便做位运算(31*i==(i<<5)-1),提高运算效率
- hash值散列分布比较均匀
③ LinkedHashMap
LinkedHashMap继承了HashMap,区别就是加上了双向链表,可以保证访问顺序(LinkedHashmap默认是数据插入顺序),是基于链表来实现数据插入有序的。
④ TreeMap
底层实现:红黑树
特点:有序(默认是key升序)
TreeMap是基于比较器Comparator来实现有序的
⑤ ConcurrentHashMap
1. ConcurrentHashMap1.7和18的底层设计和区别?
- jdk7:
使用分段锁 底层实现是数组+链表
①. ConcurrentHashMap 是由 Segment 数组结构和 HashEntry 数组结构组成,而 HashEntry 数组结构内部存储着链表我们看到了 Segment<K,V>,而他的内部,又有HashEntry数组结构组成. Segment 继承自 RentrantLock 在这里充当的是一个锁,而在其内部的HashEntry 则是用来存储键值对数据.
②. Segment 继承自 RentrantLock 在这里充当的是一个锁,所以每次使用的时候锁Segment 一个片段
缺点:Segment 在增长的时候,锁粒度也会随着增长。
- jdk8:
使用的是 synchronized 和 CAS 和 HashEntry 和红黑树
。
底层实现:数组+链表+红黑树
Set
① HashSet
底层实际就是HashMap底层
② TreeSet
底层实现:TreeMap
特点:有序