Java集合学习总结

最新推荐文章于 2023-04-01 11:50:54 发布

你们不可弃

最新推荐文章于 2023-04-01 11:50:54 发布

阅读量283

点赞数

文章标签： java 后端

本文链接：https://blog.csdn.net/weixin_42183330/article/details/104617663

版权

用最简单的语言阐述最深刻的知识，纯属个人总结，有所借鉴。

一、集合与数组

数组（可以存储基本数据类型）是用来存现对象的一种容器，但是数组的长度固定，不适合在对象数量未知的情况下使用。

集合（只能存储对象，对象类型可以不一样）的长度可变，可在多数情况下使用。

二、层次关系

Collection是集合类的根接口，List和Set继承了此接口。

Map是Java.util包中的另一个接口，与Collection接口没关系，但都属于集合类。

Iterator，所有集合类都实现了Iterator接口，用于遍历集合中元素的接口，主要包含以下三种方法：
1.hasNext() 是否还有下一个元素
2.next() 返回下一个元素
3.remove() 删除当前元素

三、几种重要的接口和类简介

List有序，可重复。关注索引，拥有一系列和索引相关的方法，查询速度快。插入、删除时，伴随着数据的移动，所以速度慢。

Set无序，不重复。集合中的对象不按特定的方式排序，只是简单地把对象加入集合中。

Map存储键值对，键不能重复，值可以重复。

四、遍历

1）Iterator：迭代输出，使用最多。

2）ListIterator：Iterator的子接口，专门用于输出List内容。

3）foreach输出：JDK1.5之后提供的新功能，可以输出数组或集合。

4）for循环

五、ArrayList和LinkedList

1）ArrayList基于动态数组，LinkedList基于链表。

2）查询：ArrayList随机定位，比较快；LinkedList移动指针。

3）新增和删除：LinedList修改指针，比较快，ArrayList移动数据填补被删除对象的空间。

六、MAP类

MAP类根据键的HashCode值存储数据，根据键可以直接获取值。

1）HashMap

HashMap继承自AbstractMap类。最多只允许一个键为Null，允许多个值为Null，线程不安全

2）Hashtable

Hashtable继承自Dictionary类，不允许键或值为null，否则报异常，线程安全，但是锁定整个表，效率低。

3）ConcurrentHashMap

线程安全，在JDK1.7采用分段式锁读取数据，可以在写操作时将锁粒度保持尽量小，同步性能好。JDK1.8之后删除了分段式锁。分段式锁：内部使用段(Segment)来表示不同部分，每个段就是一个小hash table，它们有自己的锁。只要多个修改操作发生在不同的段上，就可以并发进行。

4）LinkedHashMap

LinkedHashMap保存了数据插入顺序，在用Iteraor遍历时，先进先出，遍历时比HashMap慢。

5）TreeMap

TreeMap实现SortMap接口，把数据根据键排序，默认是按键值的升序排序（自然顺序），也可以指定排序的比较器，当用Iterator遍历TreeMap时，得到的记录是排过序的。不允许key值为空，非同步的，线程不安全

map的遍历

keySet() 取出所有键集合，根据get(key)获取值

values() 取出所有值集合，一般不常用

entrySet() 取出所有的键值对集合，迭代后getKey()，getValue()两种方法来取key和value。返回的是Entry接口。

推荐使用entrySet()方法，效率较高。
对于keySet其实遍历了两次，一次是转为iterator，一次就是从HashMap中取出key所对于的value。

而entryset只遍历了第一次，它把key和value都放到了entry中，所以快了。

七、主要实现类区别小结

Vector和ArrayList

vector线程同步，所以线程安全，而arraylist线程异步，不安全。如果不考虑到线程的安全因素，arraylist效率高。Vector由于使用了synchronized方法（线程安全）所以性能上比ArrayList要差.
vector扩容二倍，arraylist扩容1.5倍。如果在集合中使用数据量比较大的数据，用vector有优势。
ector和arraylist查询的时间复杂度是一样，为O(1)。

ArrayList和LinkList

ArrayList基于动态数组，LinkedList基于链表。
查询：ArrayList随机定位，比较快；LinkedList移动指针。
新增和删除：LinedList修改指针，比较快，ArrayList移动数据填补被删除对象的空间。

HashMap与TreeMap

HashMap通过hashcode进行快速查找，而TreeMap中元素保持着某种固定的顺序，如要得到一个有序结果就该使用TreeMap（HashMap中元素的排列顺序不固定）
插入、删除和定位元素，最好选择HashMap
如要按自然顺序或自定义顺序遍历键，TreeMap更好

使用HashMap要求添加的键类明确定义了hashCode()和 equals()的实现。
两个map中的元素一样，但顺序不一样，导致hashCode()不一样。
同样做测试：
在HashMap中，同样的值的map,顺序不同，equals时，false;
而在treeMap中，同样的值的map,顺序不同,equals时，true，说明，treeMap在equals()时是整理了顺序了的。

HashTable与HashMap

HashMap继承自AbstractMap类；HashTable继承自Dictionary类；
HashMap线程不安全；HashTable线程安全；
HashMap容量只能为2的幂，默认16，New一个HashMap容量至少为2，扩容二倍；HashTable容量任意，默认11，New一个HashTable容量可以为1，扩容二倍+1；
HashMap确定下标位运算，效率高；HashTable确定下标取余；
HashMap的Key允许一个null，value允许一个或者多个；HashTable的Key、Value不可以为null，否则会抛出NullPointerException异常；

一些关于Java集合的重要问题和答案：

1.使用集合框架的优点

（1）降低开发成本和维护成本

（2）提高代码质量

（3）复用性和可操作性

2.集合框架的泛型优点

泛型允许我们为集合提供一个可以容纳的对象类型，因此，如果你添加其它类型的任何元素，它会在编译时报错。这避免了在运行时出现ClassCastException，因为你将会在编译时得到报错信息。
泛型也使得代码整洁，我们不需要使用显式转换和instanceOf操作符。给运行时带来好处，因为不会产生类型检查的字节码指令。

3.Java集合框架的基础接口有哪些

Collection为集合层级的根接口
Set是一个有序不包含重复元素的集合
List是一个无序包含重复元素的集合
Map是一个将key映射到value的对象，不包含重复key，每个key最多只能映射一个value

4.为何Collection不从Cloneable和Serializable接口继承

Collection接口指定一组对象，对象即为它的元素。如何维护这些元素由Collection的具体实现决定。例如，List实现允许重复的元素，而Set不允许。很多Collection实现有一个公有的clone方法。然而，把它放到集合的所有实现中也是没有意义的。这是因为Collection是一个抽象表现。重要的是实现。

当与具体实现打交道的时候，克隆或序列化的语义和含义才发挥作用。所以，具体实现应该决定如何对它进行克隆或序列化，或它是否可以被克隆或序列化。

在所有的实现中授权克隆和序列化，最终导致更少的灵活性和更多的限制。特定的实现应该决定它是否可以被克隆和序列化。

5.为何Map接口不继承Collection接口

尽管Map接口和它的实现也是集合框架的一部分，但Map不是集合，集合也不是Map。因此，Map继承Collection毫无意义，反之亦然。

6.Iterator是什么

Iterator接口提供遍历任何Collection的接口。我们可以从一个Collection中使用迭代器方法来获取迭代器实例。迭代器取代了Java集合框架中的Enumeration。迭代器允许调用者在迭代过程中移除元素。

7.Enumeration和Iterator接口的区别

Enumeration的速度是Iterator的两倍，使用更少的内存。Enumeration是非常基础的，也满足了基础的需要。但是，Iterator更加安全，因为当一个集合正在被遍历的时候，它会阻止其它线程去修改集合。

迭代器取代了Java集合框架中的Enumeration。迭代器允许调用者从集合中移除元素，而Enumeration做不到。

8.为何没有像Iterator.add()这样的方法，向集合中添加元素

语义不明，已知的是，Iterator接口提供遍历任何Collection的接口。Iterator没有提供add操作，ListIterator提供add操作

9.为何迭代器没有一个方法可以直接获取下一个元素，而不需要移动游标

它可以在当前Iterator的顶层实现，但是它用得很少，如果将它加到接口中，每个继承都要去实现它，这没有意义。

10.Iterater和ListIterator之间有什么区别？

都是迭代器，当需要对集合中元素进行遍历不需要干涉其遍历过程时，这两种迭代器都可以使用

Iterator用来遍历所有集合，Set、List和Map和这些集合的子类型。而ListIterator只能用于List及其子类型
ListIterator除了遍历list外，还支持add和remove，Iterator只能遍历，尽管有remove，但是会抛异常
ListIterator和Iterator都有hasNext()和next()方法，可以实现顺序向后遍历，但ListIterator有hasPrevious()和previous()方法，可以实现逆向（顺序向前）遍历。Iterator不能
ListIterator中set()方法可以实现对象的修改，Iterator不能修改对象

11.遍历一个List有哪些不同的方式？

Iterator：迭代输出，使用最多
ListIterator：Iterator的子接口，专用于输出List
for循环
foreach输出：JDK1.5之后提供的新功能，可以输出数组或集合

迭代器更加线程安全，因为它可以确保当遍历的集合元素被更改时，抛出ConcurrentModificationException异常。

12.通过迭代器fail-fast属性，你明白了什么

每次我们尝试获取下一个元素的时候，Iterator fail-fast属性检查当前集合结构里的任何改动。如果发现任何改动，它抛出ConcurrentModificationException。

Collection中所有Iterator的实现都是按fail-fast来设计的（ConcurrentHashMap和CopyOnWriteArrayList这类并发集合类除外）。

13.fail-fast与fail-safe有什么区别

Java.util中所有集合类都为fail-fast的。Iterator的fail-fast属性与当前的集合共同起作用，不会受集合任何改动影响。
java.util.concurrent中的集合类都为fail-safe的。fail-fast迭代器会抛出异常，而fail-safe迭代器从不抛出异常。

14.在迭代一个集合的时候，如何避免ConcurrentModificationException

遍历集合时，可以使用并发集合类避免ConcurrentModificationException，比如CopyOnWriteArrayList而不是ArrayList。

15.为何Iterator接口没有具体的实现

Iterator接口定义了遍历集合的方法，但它的实现则是集合实现类的责任。每个能够返回用于遍历的Iterator的集合类都有它自己的Iterator实现内部类。

这就允许集合类去选择迭代器是fail-fast还是fail-safe的。比如，ArrayList是fail-fast的，而CopyOnWriteArrayList是fail-safe的。

16.UnsupportedOperationException是什么

UnsupportedOperationException用于表明操作不支持的异常。在JDK类中已被大量运用，在集合框架java.util.Collections.UnmodifiableCollection将会在所有add和remove操作中抛出这个异常。

17.hashCode()和equals()方法有何重要性

HashMap使用key的hashCode()和equals()方法去决定key-value对的索引。当我们从HashMap中获取值时，这些方法也会用到。

如果这些方法没有被正确地实现，在这种情况下，两个不同Key也许会产生相同的hashCode()和equals()输出，HashMap将会认为它们是相同的，然后覆盖它们，而非把它们存储到不同的地方。

所有不允许存储重复数据的集合类都使用hashCode()和equals()去查找重复，所以正确实现它们非常重要。equals()和hashCode()的实现应该遵循以下规则：

（1）如果 o1.equals(o2) ，那么 o1.hashCode() == o2.hashCode() 总为 true

（2）如果 o1.hashCode() == o2.hashCode() ，并不意味 o1.equals(o2) 为 true

18.能否使用任何类作为Map的key

可以使用任何类作为Map的key，但需要考虑以下几点：

（1）如果类重写了equals()方法，它也应该重写hashCode()方法

（2）类的所有实例需要遵循与equals()和hashCode()相关的规则

（3）如果一个类没有使用equals()，你不应该在hashCode()中使用它。

（4）用户自定义key类的最佳实践是使之为不可变的，这样，hashCode()值可以被缓存起来，拥有更好的性能。不可变的类也可以确保hashCode()和equals()在未来不会改变，这样就会解决与可变相关的问题了。

比如：

//传递给MyKey的name参数被用于equals()和hashCode()中
MyKey key = new MyKey('Pankaj'); //assume hashCode=1234
myHashMap.put(key, 'Value');
// 以下代码会改变key的hashCode()和equals()值
key.setName('Amit'); //assume new hashCode=7890
//下面会返回null，因为HashMap会尝试查找存储同样索引的key，而key已被改变了，匹配失败，返回null
myHashMap.get(new MyKey('Pankaj'));
那就是为什么String, Interger这样的wrapper类适合作为键

19.Map接口提供了哪些不同的集合视图

Map接口提供三个集合视图：

（1）keyset()：返回map中包含的所有key的一个Set视图。

（2）values()：返回一个map中包含的所有value的一个Collection视图。

（3）entrySet()：返回一个map钟包含的所有映射的一个集合视图。

20.HashMap和HashTable有何不同

（1）HashMap继承自AbstractMap类；HashTable继承自Dictionary类

（2）HashMap线程不安全；HashTable线程安全

（3）HashMap容量只能为2的幂、默认16、New一个HashMap容量至少为2，扩容二倍；HashTable容量任意、默认11、New一个HashTable容量可以为1，扩容二倍+1

（4）HashMap确定下标位运算，效率高；HashTable确定下标取余

（5）HashMap的Key允许一个null，value允许一个或者多个；HashTable的Key、Value不可以为null，否则会抛出NullPointerException异常

21.如何决定选用HashMap还是TreeMap

（1）对于插入、删除和定位元素这类操作，HashMap是最好选择。

（2）对于遍历一个有序的key集合，TreeMap是更好选择。

22.ArrayList和Vector有何异同点

相同点：

（1）基于索引的，内部是数组

（2）数据有序插入

（3）迭代器都是fail-fast的

（4）允许null值，使用索引值对元素进行随机访问

不同点：

（1）Vector是同步，安全；ArrayList异步，不安全

（2）ArrayList效率高，因为Vector由于使用了synchronized修饰的方法

（3）vector扩容二倍，arraylist扩容1.5倍。如果在集合中使用数据量比较大的数据，用vector有优势

23.Array和ArrayList有何区别？什么时候更适合用Array

Array可以容纳基本类型和对象，而ArrayList只能容纳对象。

Array是指定大小的，而ArrayList大小是固定的。

Array没有提供ArrayList那么多功能，比如addAll、removeAll和iterator等。尽管ArrayList明显是更好的选择，但也有些时候Array比较好用：

（1）如果列表的大小已经指定，大部分情况下是存储和遍历它们

（2）对于遍历基本数据类型

（3）如果使用多维数组，使用 [][] 比 List<List<>> 更容易

24.ArrayList和LinkedList有何区别

ArrayList和LinkedList两者都实现了List接口，但是它们之间有些不同。

（1）ArrayList基于动态数组，LinkedList基于链表

（2）查询：ArrayList随机定位，比较快；LinkedList移动指针

（3）新增和删除：LinedList修改指针，比较快，ArrayList移动数据填补被删除对象的空间

（4）LinkedList比ArrayList消耗更多的内存，因为LinkedList中的每个节点存储了前后节点的引用

25.哪些集合类提供对元素的随机访问

ArrayList、HashMap、TreeMap和HashTable类提供对元素的随机访问。

26.EnumSet是什么

java.util.EnumSet是使用枚举类型的集合实现。当集合创建时，枚举集合中的所有元素必须来自单个指定的枚举类型，可以是显示的或隐示的。EnumSet是不同步的，不允许值为null的元素。它也提供了一些有用的方法，比如copyOf(Collection c)、of(E first,E…rest)和complementOf(EnumSet s)。

27.哪些集合类是线程安全的

Vector、HashTable、Properties和Stack是同步类，所以是线程安全的，可以在多线程环境下使用。Java1.5并发API包括一些集合类，允许迭代时修改，因为它们都工作在集合的克隆上，所以它们在多线程环境中是安全的。

28.并发集合类是什么

Java1.5并发包（java.util.concurrent）包含线程安全集合类，允许在迭代时修改集合。迭代器被设计为fail-fast的，会抛出ConcurrentModificationException。一部分类为：CopyOnWriteArrayList、 ConcurrentHashMap、CopyOnWriteArraySet。

29.BlockingQueue是什么

Java.util.concurrent.BlockingQueue是一个队列，在进行检索或移除一个元素的时候，它会等待队列变为非空；当在添加一个元素时，它会等待队列中的可用空间。BlockingQueue接口是Java集合框架的一部分，主要用于实现生产者-消费者模式。我们不需要担心等待生产者有可用的空间，或消费者有可用的对象，因为它都在BlockingQueue的实现类中被处理了。Java提供了集中BlockingQueue的实现，比如ArrayBlockingQueue、LinkedBlockingQueue、PriorityBlockingQueue,、SynchronousQueue等。

30.队列和栈是什么，列出它们的区别

栈和队列两者都被用来预存储数据。java.util.Queue是一个接口，它的实现类在Java并发包中。队列允许先进先出（FIFO）检索元素，但并非总是这样。Deque接口允许从两端检索元素。

栈与队列很相似，但它允许对元素进行后进先出（LIFO）进行检索。

Stack是一个扩展自Vector的类，而Queue是一个接口。

31.Collections类是什么

Java.util.Collections是一个工具类仅包含静态方法，它们操作或返回集合。它包含操作集合的多态算法，返回一个由指定集合支持的新集合和其它一些内容。这个类包含集合框架算法的方法，比如折半搜索、排序、混编和逆序等。

32.Comparable和Comparator接口是什么

如果我们想使用Array或Collection的排序方法时，需要在自定义类里实现Java提供Comparable接口。Comparable接口有compareTo(T OBJ)方法，它被排序方法所使用。我们应该重写这个方法，如果“this”对象比传递的对象参数更小、相等或更大时，它返回一个负整数、0或正整数。但是，在大多数实际情况下，我们想根据不同参数进行排序。比如，作为一个CEO，我想对雇员基于薪资进行排序，一个HR想基于年龄对他们进行排序。这就是我们需要使用Comparator接口的情景，因为Comparable.compareTo(Object o)方法实现只能基于一个字段进行排序，我们不能根据对象排序的需要选择字段。Comparator接口的compare(Object o1, Object o2)方法的实现需要传递两个对象参数，若第一个参数比第二个小，返回负整数；若第一个等于第二个，返回0；若第一个比第二个大，返回正整数。

33.Comparable和Comparator接口有何区别

Comparable和Comparator接口被用来对对象集合或者数组进行排序。Comparable接口被用来提供对象的自然排序，我们可以使用它来提供基于单个逻辑的排序。

Comparator接口被用来提供不同的排序算法，我们可以选择需要使用的Comparator来对给定的对象集合进行排序。

34.我们如何对一组对象进行排序