【基础】Java集合类整理（面试）

最新推荐文章于 2024-07-20 16:53:03 发布

保诚

最新推荐文章于 2024-07-20 16:53:03 发布

阅读量186

点赞数

分类专栏：基础文章标签： Java集合面试

本文链接：https://blog.csdn.net/baocheng_521/article/details/79788094

版权

基础专栏收录该内容

4 篇文章 0 订阅

订阅专栏

整合多处大神所整理的，加上一些自己笔记：

https://www.cnblogs.com/chanshuyi/p/4998776.html

https://blog.csdn.net/u012422829/article/details/45170157

https://blog.csdn.net/cocacola456/article/details/66971148

https://www.cnblogs.com/pureEve/p/6546286.html

https://www.imooc.com/article/23665?block_id=tuijian_wz

1、介绍Collection框架的结构

集合是Java中的一个非常重要的一个知识点，主要分为List、Set、Map、Queue三大数据结构。它们在Java中的结构关系如下：

Collection接口是List、Set、Queue的父级接口。

Set接口有两个常用的实现类：HashSet和TreeSet。List接口的常用接口有ArrayList和Vector接口。

Map接口有两个常用的实现类：Hashtable和HashMap。

接口：Collection

主要的一个接口方法：boolean add(Ojbect c)
虽然返回的是boolean，但不是表示添加成功与否，这个返回值表示的意义是add()执行后，集合的内容是否改变了（就是元素的数量、位置等有无变化）。类似的addAll，remove，removeAll，remainAll也是一样的。

Vector类

Vector非常类似ArrayList，但是Vector是同步的。由Vector创建的Iterator，虽然和ArrayList创建的Iterator是同一接口，但是，因为Vector是同步的，当一个Iterator被创建而且正在被使用，另一个线程改变了Vector的状态（例如，添加或删除了一些元素），这时调用Iterator的方法时将抛出ConcurrentModificationException，因此必须捕获该异常。

总结

如果涉及到堆栈，队列等操作，应该考虑用List，对于需要快速插入，删除元素，应该使用LinkedList，如果需要快速随机访问元素，应该使用ArrayList。
如果程序在单线程环境中，或者访问仅仅在一个线程中进行，考虑非同步的类，其效率较高，如果多个线程可能同时操作一个类，应该使用同步的类。
要特别注意对哈希表的操作，作为key的对象要正确复写equals和hashCode方法。
尽量返回接口而非实际的类型，如返回List而非ArrayList，这样如果以后需要将ArrayList换成LinkedList时，客户端代码不用改变。这就是针对抽象编程。

2、ArrayList和Vector的区别（是否有序、是否重复、数据结构、底层实现）

ArrayList和Vector都实现了List接口，他们都是有序集合，并且存放的元素是允许重复的。它们的底层都是通过数组来实现的，因此列表这种数据结构检索数据速度快，但增删改速度慢。

而ArrayList和Vector的区别主要在两个方面：

第一，线程安全。Vector是线程安全的，而ArrayList是线程不安全的。因此在如果集合数据只有单线程访问，那么使用ArrayList可以提高效率。而如果有多线程访问你的集合数据，那么就必须要用Vector，因为要保证数据安全。

第二，数据增长。ArrayList和Vector都有一个初始的容量大小，当存储进它们里面的元素超过了容量时，就需要增加它们的存储容量。ArrayList每次增长原来的0.5倍，而Vector增长原来的一倍。ArrayList和Vector都可以设置初始空间的大小，Vector还可以设置增长的空间大小，而ArrayList没有提供设置增长空间的方法。

3、HashMap和Hashtable的区别

HashMap和Hashtable都实现了Map接口，并且都是key-value的数据结构。它们的不同点主要在三个方面：

第一，Hashtable是Java1.1的一个类，它基于陈旧的Dictionary类。而HashMap是Java1.2引进的Map接口的一个实现。

第二，Hashtable是线程安全的，也就是说是线程同步的，而HashMap是线程不安全的。也就是说在单线程环境下应该用HashMap，这样效率更高。

第三，HashMap允许将null值作为key或value，但Hashtable不允许（会抛出NullPointerException）。

HashMap允许键和值是null，而Hashtable不允许键或者值是null。
Hashtable是同步的，而HashMap不是。因此，HashMap更适合于单线程环境，而Hashtable适合于多线程环境。

HashMap提供了可供应用迭代的键的集合，因此，HashMap是快速失败（具体看下文)的。另一方面，Hashtable提供了对键的列举(Enumeration)。

一般认为Hashtable是一个遗留的类。

hashmap和hashtable

hashmap	线程不安全	允许有null的键和值	效率高一点、	方法不是Synchronize的要提供外同步	有containsvalue和containsKey方法	HashMap 是Java1.2 引进的Map interface 的一个实现	HashMap是Hashtable的轻量级实现
hashtable	线程安全	不允许有null的键和值	效率稍低、	方法是是Synchronize的	有contains方法方法	、Hashtable 继承于Dictionary 类	Hashtable 比HashMap 要旧

不同详细： https://blog.csdn.net/shohokuf/article/details/3932967

4、List 和 Map 区别？（数据结构，存储特点）

这个要从两个方面来回答，一方面是List和Map的数据结构，另一方面是存储数据的特点。在数据结构方面，List存储的是单列数据的集合，而Map存储的是key、value类型的数据集合。在数据存储方面，List存储的数据是有序且可以重复的，而Map中存储的数据是无序且key值不能重复（value值可以重复）。

5、ArrayList,Vector, LinkedList的存储性能和特性

ArrayList 和Vector都是使用数组方式存储数据，此数组元素数大于实际存储的数据以便增加和插入元素，它们都允许直接按序号索引元素，但是插入元素要涉及数组元素移动等内存操作，所以索引数据快而插入数据慢，Vector由于使用了synchronized方法（线程安全），通常性能上较ArrayList差，而LinkedList使用双向链表实现存储，按序号索引数据需要进行前向或后向遍历，但是插入数据时只需要记录本项的前后项即可，所以插入速度较快。

6、Collection 和 Collections的区别

1、java.util.Collection 是一个集合接口。它提供了对集合对象进行基本操作的通用接口方法。Collection接口在Java 类库中有很多具体的实现。Collection接口的意义是为各种具体的集合提供了最大化的统一操作方式。

Collection
├List
│ ├LinkedList
│ ├ArrayList
│ └Vector
│ └Stack
└Set
2、java.util.Collections 是一个包装类。它包含有各种有关集合操作的静态多态方法。此类不能实例化，就像一个工具类，服务于Java的Collection框架。

Collections类的方法：

排序(Sort)

使用sort方法可以根据元素的自然顺序对指定列表按升序进行排序。列表中的所有元素都必须实现 Comparable接口。此列表内的所有元素都必须是使用指定比较器可相互比较的

可以直接Collections.sort(...)

shuffle(Collection) ：对集合进行随机排序

binarySearch(Collection,Object)方法的使用(含义：查找指定集合中的元素，返回所查找元素的索引)

max(Collection),max(Collection,Comparator)方法的使用(前者采用Collection内含自然比较法，后者采用Comparator进行比较)

min(Collection),min(Collection,Comparator)方法的使用(前者采用Collection内含自然比较法，后者采用Comparator进行比较)。
indexOfSubList(List list,List subList)方法的使用(含义：查找subList在list中首次出现位置的索引)。

lastIndexOfSubList(List source,List target)方法的使用与上例方法的使用相同，在此就不做介绍了。
replaceAll(List list,Object old,Object new)方法的使用(含义：替换批定元素为某元素,若要替换的值存在刚返回true,反之返回false)。

hashmap原理

Java中的HashMap是以键值对(key-value)的形式存储元素的。HashMap需要一个hash函数，它使用hashCode()和equals()方法来向集合/从集合添加和检索元素。当调用put()方法的时候，HashMap会计算key的hash值，然后把键值对存储在集合中合适的索引上。如果key已经存在了，value会被更新成新值。HashMap的一些重要的特性是它的容量(capacity)，负载因子(load factor)和扩容极限(threshold resizing)。

HashMap采取数组加链表的存储方式来实现。亦即数组（散列桶）中的每一个元素都是链表，

原理详细链接： http://zhangshixi.iteye.com/blog/672697

让hashmap变成线程安全的两种方法

方法一:通过Collections.synchronizedMap()返回一个新的Map,这个新的map就是线程安全的. 这个要求大家习惯基于接口编程,因为返回的并不是HashMap,而是一个Map的实现.

[java] view plain copy

Map map = Collections.synchronizedMap(new HashMap());

方法二:使用ConcurrentHashMap

[java] view plain copy

Map<String, Integer> concurrentHashMap = new ConcurrentHashMap<String, Integer>();

快速失败(fail-fast)和安全失败(fail-safe)

Fail-Fast机制：

我们知道java.util.HashMap不是线程安全的，因此如果在使用迭代器的过程中有其他线程修改了map，那么将抛ConcurrentModificationException，这就是所谓fail-fast策略。

这一策略在源码中的实现是通过modCount域，modCount顾名思义就是修改次数，对HashMap内容的修改都将增加这个值，那么在迭代器初始化过程中会将这个值赋给迭代器的expectedModCount。

    Java代码   
    
  
 HashIterator() {  
     expectedModCount = modCount;  
     if (size > 0) { // advance to first entry  
     Entry[] t = table;  
     while (index < t.length && (next = t[index++]) == null)  
         ;  
     }  
 }  

在迭代过程中，判断modCount跟expectedModCount是否相等，如果不相等就表示已经有其他线程修改了Map：

注意到modCount声明为volatile，保证线程之间修改的可见性。

    Java代码   
    
  
 final Entry<K,V> nextEntry() {     
     if (modCount != expectedModCount)     
         throw new ConcurrentModificationException();  

在HashMap的API中指出：

由所有HashMap类的“collection 视图方法”所返回的迭代器都是快速失败的：在迭代器创建之后，如果从结构上对映射进行修改，除非通过迭代器本身的 remove 方法，其他任何时间任何方式的修改，迭代器都将抛出ConcurrentModificationException。因此，面对并发的修改，迭代器很快就会完全失败，而不冒在将来不确定的时间发生任意不确定行为的风险。

注意，迭代器的快速失败行为不能得到保证，一般来说，存在非同步的并发修改时，不可能作出任何坚决的保证。快速失败迭代器尽最大努力抛出 ConcurrentModificationException。因此，编写依赖于此异常的程序的做法是错误的，正确做法是：迭代器的快速失败行为应该仅用于检测程序错误。

Fail-Safe机制：

Iterator的安全失败是基于对底层集合做拷贝，因此，它不受源集合上修改的影响。java.util包下面的所有的集合类都是快速失败（一般的集合类)的，而java.util.concurrent包下面的所有的类(比如CopyOnWriteArrayList，ConcurrentHashMap ）都是安全失败的。快速失败的迭代器会抛出ConcurrentModificationException异常，而安全失败的迭代器永远不会抛出这样的异常。

fail-fast 与 fail-safe 之间的区别？

- Fail fast快速地报告任何的failure。无论何时任何一个问题都会引发 fail fast系统fails
- 在Java Fail fast 迭代器中，迭代objects集合有时会出现并发修改异常，出现这种情况有2个原因
- 如果一个线程正在迭代一个集合，而另一个线程同时试图修改这个集合
- 在调用remove()方法后，如何我们还试图去修改集合obje

Tree, Hash ,Linked

再看看这个图。

发现set和map的实现分成了 Tree,Hash,和Linked。

以map为例，来看看这三者的区别.

TreeMap用红黑树实现，能够把它保存的记录根据键排序，默认是按升序排序，也可以指定排序的比较器。当用Iteraor遍历TreeMap时，得到的记录是排过序的。TreeMap的键和值都不能为空。

HashMap上文有说。

LinkedHashmap：它继承与HashMap、底层使用哈希表与双向链表来保存所有元素。其基本操作与父类HashMap相似，它通过重写父类相关的方法，来实现自己的链接列表特性。put方法没有重写，重写了addEntry()。（因为加入的时候要维护好一个双向链表的结构）LinkedHashMap重写了父类HashMap的get方法，实际在调用父类getEntry()方法取得查找的元素后，再判断当排序模式accessOrder为true时，记录访问顺序，将最新访问的元素添加到双向链表的表头，并从原来的位置删除。由于的链表的增加、删除操作是常量级的，故并不会带来性能的损失(accessOrder是LinkedHashmap中的一个属性，用来判断是否要根据读取顺序来重写调整结构。如果为false，就按照插入的顺序排序，否则按照最新访问的放在链表前面的顺序，以提高性能）。

我个人的理解是：LinedHashMap的作用就是在让经常访问的元素更快的被访问到。用双向链表可以方便地执行链表中元素的插入删除操作。

保诚

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【基础】Java集合类整理（面试）

整合多处大神所整理的，加上一些自己笔记：https://www.cnblogs.com/chanshuyi/p/4998776.htmlhttps://blog.csdn.net/u012422829/article/details/45170157https://blog.csdn.net/cocacola456/article/details/66971148https:/
复制链接

扫一扫