我们在实际工作中,应用最多的 List,应该是 ArrayList、LinkedList,我们先上一张图,回顾一下。
接下来,我们聊一些图中没有内容(图中内容可以自己看看源码,深入了解一下)
另外本人整理了20年面试题大全,包含spring、并发、数据库、Redis、分布式、dubbo、JVM、微服务等方面总结,下图是部分截图,需要的话点这里点这里,暗号CSDN。
一、底层是数组结构的 ArrayList 为什么查询快?
大多数人是这么回答的,因为连续的内存地址,通过下标访问,所以快!没有错,但再深入一些呢?
再深入些就涉及到了 CPU 多级缓存和缓存行的概念。为了解决 CPU 运算速度与内存读写速度不匹配,引入了高速缓存,一般有一级缓存、二级缓存、三级缓存。每个缓存都是由缓存行(Cache Line)组成,缓存行大小是 64KB。当 CPU 从主内存拉取数据时,会把相邻的数据一块存入一个 Cache Line,所以当数组中的一个值被加载到高速缓存时,会自动加载数组中其他的值。所以你能快速的遍历这个数组。利用 Cache Line 和 不利用 Cache Line 特性的效率大概会差 1 倍多呢。
如果多个线程操作同一个 Cache Line,就会造成伪共享,这个后续讲阻塞队列的时候再聊。
二、数组和链表两种数据结构,对垃圾回收的影响?
数组分配内存时,需要连续的内存空间,如果数组太大,可能会存在内存碎片,导致触发垃圾回收或者分配失败,数组太小会导致不够用,会重新分配更大的内存,然后进行数据拷贝,非常耗时。但合适的数组大小,在对其操作时,不会频繁的触发垃圾回收,减少 Java 的垃圾回收对系统性能的影响。
链表每次添加一项数据,都会创建一个对象,给对象分配内存,而且每个对象还要存储前驱和后驱的节点指针,耗内存较多。而且对链表频繁的操作,造成内存频繁的申请和释放,导致内存碎片和触发垃圾回收,会对系统性能导致非常不稳定。一般的解决方法都是通过缓存或对象池来解决。比如 Apache Common Collection 下的 NodeCachingLinkedList。
三、写代码时,对 List 操作的一些工具类和技巧
利用 guava 的工厂类初始化集合
//构建 ArrayList
Lists.newArrayList();
//构建 LinkedList
Lists.newLinkedList();
//构建指定大小的 ArrayList
Lists.newArrayListWithCapacity(100);
//构建读写分离的 List
Lists.newCopyOnWriteArrayList();
对集合进行交集、并集、差集、反转、分割、删除等操作
List<String> list1 = Lists.newArrayList("2", "1");
List<String> list2 = Lists.newArrayList("2", "5", "6");
//list1 和 list2 的交集
list1.retainAll(list2);
// 并集
list1.addAll(list2);
// 去重复并集
list2.removeAll(list1);
list1.addAll(list2);
//差集
list1.removeAll(list2);
//通过 guava 方法反转
Lists.reverse(list1);
//按指定条数分割
List<List<String>> list3 = Lists.partition(list, 2);
//删除某元素
list1