Java集合面试题
-
Collection:Collection是集合List、Set、Queue的最基本的接口。
-
Iterator:迭代器,可以通过迭代器遍历集合中的数据
-
Map:是映射表的基础接口
1. Java 集合类框架的基本接口有哪些?
Java 容器分为 Collection 和 Map 两大类,其下又有很多子类。
-
Collection
-List
--ArrayList
--LinkedList
--Vector
--Stack
-Set
--HashSet
--LinkedHashSet
--TreeSet
-Queue
--LinkedList 大小可变的链表双端队列,允许元素为插入null。
--ArrayDeque 大下可变的数组双端队列,不允许插入null。
--ConcurrentLinkedDeque 大小可变且线程安全的链表双端队列,非阻塞,不允许插入null。
--LinkedBlockingDeque 为线程安全的双端队列,在队列为空的情况下,获取操作将会阻塞,直到有元素添加。
--DelayQueue 延迟队列
-
Map
-HashMap
--LinkedHashMap
-TreeMap
-ConcurrentHashMap
-Hashtable
2. ArrayList 和 Vector 的区别?
- 线程安全:Vector 使用了 Synchronized 来实现线程同步,是线程安全的,而 ArrayList 是非线程安全的。
- 性能:ArrayList 在性能方面要优于 Vector。
- 扩容:ArrayList 和 Vector 都会根据实际的需要动态的调整容量,只不过在 Vector 扩容每次会增加 1 倍,而 ArrayList 只会增加 0.5倍。
3. 说说 ArrayList,Vector, LinkedList 的存储性能和特性?
- ArrayList(数组)
ArrayList 内部是通过数组实现的,它允许对元素进行快速随机访问。数组的缺点是每个元素之间不能有间隔,当数组大小不满足时需要增加存储能力,就要将已经有数组的数据复制到新的存储空间中。当从 ArrayList 的中间位置插入或者删除元素时,需要对数组进 行复制、移动、代价比较高。因此,它适合随机查找和遍历,不适合插入和删除。 - Vector(数组实现、线程同步)
Vector与ArrayList一样,也是通过数组实现的,不同的是它支持线程的同步,即某一时刻只有一个线程能够写 Vector,避免多线程同时写而引起的不一致性。但实现同步需要很高的花费,因此, 访问它比访问ArrayList慢。 - LinkedList(链表)
LinkedList是用链表结构存储数据的,很适合数据的动态插入和删除,随机访问和遍历速度比较慢。另外,他还提供了头插addFirst()
和尾插addLast()
的方法。
4. Java中的队列?
-
非阻塞队列
- ArrayDeque 数组结构,不可存null值。
- LinkedList 链表结构,可以存null值。
-
阻塞队列
- ArrayBlockingQueue 基于数组的阻塞队列实现,维护了一个定长数组。
- LinkedBlockingQueue 基于链表的阻塞队列。
-
延迟队列
- DelayQueue 将任务放在该延时对列中,只有到了延时时间才能从对列中获取到任务。
阻塞队列:当队列是空的时,从队列中获取元素的操作将会被阻塞,或者当队列是满时,往队列里添加元素的操作会被阻塞。
延迟队列:队列中插入数据的操作(生产者)永远不会被阻塞,而只有获取数据的操作(消费者)才会被阻塞。
5. 快速失败 (fail-fast) 和安全失败 (fail-safe) 的区别是什么?
- 快速失败(fail—fast)
在用迭代器遍历一个集合对象时,如果遍历过程导致集合中元素个数变化(例如: add、remove、clear),则会抛出ConcurrentModificationException。
原理 : 迭代器在遍历时直接访问集合中的内容,并且在遍历过程中使用一个 modCount 变量。集合在被遍历期间如果元素数量发生变化,就会改变modCount的值。每当迭代器使用hashNext()/next()遍历下一个元素之前,都会检测modCount和expectedmodCount值是否相等,是的话就返回遍历;否则抛出异常ConcurrentModificationException,终止遍历。
**注意:**这里异常的抛出条件是检测到 modCount != expectedmodCount 这个条件。如果集合发生变化时修改modCount值刚好又设置为了expectedmodCount值,则异常不会抛出。因此,不能依赖于这个异常是否抛出而进行并发操作的编程,这个异常只建议用于检测并发修改的bug。
场景: java.util包下的集合类都是快速失败的,不能在多线程下发生并发修改(迭代过程中被修改)。
- 安全失败(fail—safe)
采用安全失败机制的集合容器,在遍历时不是直接在集合内容上访问的,而是先复制原有集合内容,在拷贝的集合上进行遍历。
原理: 由于迭代时是对原集合的拷贝进行遍历,所以在遍历过程中对原集合所作的修改并不能被迭代器检测到,所以不会触发ConcurrentModificationException。
缺点: 基于拷贝内容的优点是避免了Concurrent Modification Exception,但同样地,迭代器并不能访问到修改后的内容,即:迭代器遍历的是开始遍历那一刻拿到的集合拷贝,在遍历期间原集合发生的修改迭代器是不知道的。
场景: java.util.concurrent包下的容器都是安全失败,可以在多线程下并发使用,并发修改。
6. 说一下 HashMap 的实现原理?
首先HashMap 是K,V数据结构。HashMap put()方法会根据 key.hashCode() 计算出 hash 值,根据 hash 值计算出 index 将 value 保存在 buckets 数组里。当计算出的 hash 值相同时,我们称之为 hash 冲突。
HashMap 数据结构实现:
- Jdk1.6/1.7 数组 + 链表
- Jdk1.8 数组 + 链表 + 红黑树
HashMap 扩容:
- capacity:当前数组容量,始终保持 2^n,可以扩容,扩容后数组大小为当前的 2 倍。
- loadFactor:负载因子,默认为 0.75。
- threshold:扩容的阈值,等于 capacity * loadFactor
if (++size > threshold)
resize();
解决Hash冲突:
-
Separate chaining 链地址法/拉链法
-
Open addressing 线性探测法
HashMap 的做法是使用第一种 链地址法 解决冲突。 这个“链”使用的具体是什么数据结构,不同的版本稍有不同。
在 Jdk1.6 和 1.7 中,是用链表存储的,这样如果碰撞很多的话,就变成了在链表上的查找,worst case 就是 O(n);
在 JDK 1.8 进行了优化,当链表长度较大时(超过 8),会采用红黑树来存储,这样大大提高了查找效率。
即当 hash 冲突的个数比较少时,使用链表否则使用红黑树。
7. Java 解决 hash 冲突时为什么链表长度超过“8”才用红黑树?
红黑树查找的时间复杂度是 O(logn) ;而链表查找元素的时间复杂度为 O(n) 。 当长度为 8 的时候,概率仅为 0.00000006。这是一个小于千万分之一的概率。 通常我们的 Map 里面是不会存储这么多的数据的,所以通常情况下,并不会发生从链表向红黑树的转换。
8. HashMap 为什么说是线程不安全的?
- put 方法中的 ++modCount 问题
- 扩容期间取值不准确
- 同时 put 碰撞导致数据丢失
9. HashMap 不安全可以用什么替代?
- Collections.synchronizedCollection()
- HashTable
- ConcurrentHashMap
10. Java8的ConcurrentHashMap为什么放弃了分段锁,有什么问题吗,如果你来设计,你如何设计?
Java 7 采用 Segment 分段锁来保证安全,而 Segment 是继承自 ReentrantLock。
Java 8 中放弃了 Segment 的设计,采用 Node + CAS + synchronized 保证线程安全。
11. 有没有有顺序的Map实现类,如果有,他们是怎么保证有序的?
TreeMap 是红黑树数据结构。
红黑树数据结构特性:
- 每个节点都只能是红色或者黑色
- 根节点是黑色
- 每个叶节点(NIL节点,空节点)是黑色的。
- 如果一个结点是红的,则它两个子节点都是黑的。也就是说在一条路径上不能出现相邻的两个红色结点。
- 从任一节点到其每个叶子的所有路径都包含相同数目的黑色节点。
12.Set 里的元素是不能重复的,那么用什么方法来区分重复与否呢?是用 == 还是 equals()?它们有何区别?
13.说一下 HashSet 的实现原理?
HashSet 是基于 HashMap 实现的,HashSet 底层使用 HashMap 来保存所有元素,因此 HashSet 的实现比较简单,相关 HashSet 的操作,基本上都是直接调用底层 HashMap 的 相关方法来完成,HashSet 不允许重复的值。
15.HashSet 和 TreeSet 有什么区别?
14.heap 和 stack 有什么区别?
堆是堆(heap),栈是栈(stack),堆栈是栈。
- JVM栈: JVM规范让每个Java线程拥有自己的独立的JVM栈,也就是Java方法的调用栈。
- JVM堆: JVM里的“堆”(heap)特指用于存放Java对象的内存区域。
最主要的区别就是栈用来存储方法调用。 而堆用来存储 new 的对象。
注意,这个“堆”并不是数据结构意义上的堆(Heap (data structure),一种有序的树)
17.LinkedHashMap 的实现原理?
双向链表
18.什么是迭代器 (Iterator)?
Iterator 接口提供遍历任何 Collection 的接口。我们可以从一个 Collection 中使用迭代器方法来获取迭代器实例。迭代器取代了 Java 集合框架中的 Enumeration,迭代器允许调用者在迭代过程中 使用迭代器提供的方法移除元素。
19.Iterator 和 ListIterator 的区别是什么?
-
Iterator 可以遍历 Set 和 List 集合,而 ListIterator 只能遍历 List。
-
Iterator 只能单向遍历,而 ListIterator 可以双向遍历(向前/后遍历)。
-
ListIterator 从 Iterator 接口继承,然后添加了一些额外的功能,比如添加一个 元素、替换一个元素、获取前面或后面元素的索引位置
20.数组 (Array) 和列表 (ArrayList) 有什么区别?什么时候应该使用 Array 而不是 ArrayList?
-
Array 可以存储基本数据类型和对象,ArrayList 只能存储对象。
-
Array 是指定固定大小的,而 ArrayList 大小是自动扩展的(初始化容量10,每次扩容0.5倍)。
-
Array 内置方法没有 ArrayList 多,比如 addAll、removeAll、iteration 等方法 只有 ArrayList 有。
21. 怎么确保一个集合不能被修改?
可以使用 Collections. unmodifiableCollection(Collection c) 方法来创建一个 只 读 集 合 , 这 样 改 变 集 合 的 任 何 操 作 都 会 抛 出 Java. lang. UnsupportedOperationException 异常。
List<String> list = new ArrayList<>();
list.add("x");
Collection<String> clist = Collections.unmodifiableCollection(list);
clist.add("y"); // 运行时此行报错
System.out.println(list.size());
22.Comparable 和 Comparator 接口是干什么的?列出它们的区别
二者均是对集合进行比较和排序的接口。
public interface Comparable<T> {
public int compareTo(T o);
}
public interface Comparator<T> {
public int compare(T lhs, T rhs);
public boolean equals(Object object);
}
-
comparable是需要两个比较的对象来实现接口。这样对象调用实现的方法来比较。对类的耦合度高(需要改变类的内部结构,破坏性大)。
class UserInfo implements Comparable<UserInfo>{ @Override public int compareTo(UserInfo o) { if(this.age-o.age==0){ return this.userid-o.userid; }else{ return this.age-o.age; } } } //对list排序 Collections.sort(list);
-
comparator相当于一通用的比较工具类接口。需要定制一个比较类去实现它,重写里面的compare方法,方法的参数即是需要比较的对象。对象不用做任何改变。
class MyComparator implements Comparator<UserInfo>{ @Override public int compare(UserInfo o1,UserInfo o2) { if(o1.getAge()-o2.getAge()==0){ return o1.getUserid()-o2.getUserid(); }else{ return o1.getAge()-o2.getAge(); } } } //对list排序 Collections.sort(list,comparator);
23.Collection 和 Collections 的区别?
- Collection 是一个集合接口,它提供了对集合对象进行基本操作的通用接口方法,所有集合都是它的子类,比如 List、Set 等。
- Collections 是一个包装类,包含了很多静态方法,不能被实例化,就像一个工具类, 比如提供的排序方法: Collections. sort(list)。