Java集合学习总结

用最简单的语言阐述最深刻的知识,纯属个人总结,有所借鉴。

一、集合与数组

数组(可以存储基本数据类型)是用来存现对象的一种容器,但是数组的长度固定,不适合在对象数量未知的情况下使用。

集合(只能存储对象,对象类型可以不一样)的长度可变,可在多数情况下使用。

二、层次关系

Collection是集合类的根接口,List和Set继承了此接口。

Map是Java.util包中的另一个接口,与Collection接口没关系,但都属于集合类。

Iterator,所有集合类都实现了Iterator接口,用于遍历集合中元素的接口,主要包含以下三种方法:
1.hasNext()    是否还有下一个元素
2.next()          返回下一个元素
3.remove()     删除当前元素

三、几种重要的接口和类简介

List有序,可重复。关注索引,拥有一系列和索引相关的方法,查询速度快。插入、删除时,伴随着数据的移动,所以速度慢。

Set无序,不重复。集合中的对象不按特定的方式排序,只是简单地把对象加入集合中。

Map存储键值对,键不能重复,值可以重复。

四、遍历

1)Iterator:迭代输出,使用最多。

2)ListIterator:Iterator的子接口,专门用于输出List内容。

3)foreach输出:JDK1.5之后提供的新功能,可以输出数组或集合。

4)for循环

五、ArrayList和LinkedList

1)ArrayList基于动态数组,LinkedList基于链表。 

2)查询:ArrayList随机定位,比较快;LinkedList移动指针。

3)新增和删除:LinedList修改指针,比较快,ArrayList移动数据填补被删除对象的空间。

六、MAP类

MAP类根据键的HashCode值存储数据,根据键可以直接获取值。

1)HashMap 

HashMap继承自AbstractMap类。最多只允许一个键为Null,允许多个值为Null,线程不安全

2)Hashtable

Hashtable继承自Dictionary类,不允许键或值为null,否则报异常,线程安全,但是锁定整个表,效率低。

3)ConcurrentHashMap

线程安全,在JDK1.7采用分段式锁读取数据,可以在写操作时将锁粒度保持尽量小,同步性能好。JDK1.8之后删除了分段式锁。分段式锁:内部使用段(Segment)来表示不同部分,每个段就是一个小hash table,它们有自己的锁。只要多个修改操作发生在不同的段上,就可以并发进行。

4)LinkedHashMap

LinkedHashMap保存了数据插入顺序,在用Iteraor遍历时,先进先出,遍历时比HashMap慢。

5)TreeMap

TreeMap实现SortMap接口,把数据根据键排序,默认是按键值的升序排序(自然顺序),也可以指定排序的比较器,当用Iterator遍历TreeMap时,得到的记录是排过序的。不允许key值为空,非同步的,线程不安全

map的遍历

    keySet()   取出所有键集合,根据get(key)获取值

    values()    取出所有值集合,一般不常用

    entrySet() 取出所有的键值对集合,迭代后getKey(),getValue()两种方法来取key和value。返回的是Entry接口。

推荐使用entrySet()方法,效率较高。
对于keySet其实遍历了两次,一次是转为iterator,一次就是从HashMap中取出key所对于的value。

而entryset只遍历了第一次,它把key和value都放到了entry中,所以快了。

七、主要实现类区别小结

Vector和ArrayList

  • vector线程同步,所以线程安全,而arraylist线程异步,不安全。如果不考虑到线程的安全因素,arraylist效率高。Vector由于使用了synchronized方法(线程安全)所以性能上比ArrayList要差.
  • vector扩容二倍,arraylist扩容1.5倍。如果在集合中使用数据量比较大的数据,用vector有优势。
  • ector和arraylist查询的时间复杂度是一样,为O(1)。

ArrayList和LinkList

  • ArrayList基于动态数组,LinkedList基于链表。 
  • 查询:ArrayList随机定位,比较快;LinkedList移动指针。
  • 新增和删除:LinedList修改指针,比较快,ArrayList移动数据填补被删除对象的空间。

HashMap与TreeMap

  • HashMap通过hashcode进行快速查找,而TreeMap中元素保持着某种固定的顺序,如要得到一个有序结果就该使用TreeMap(HashMap中元素的排列顺序不固定)
  • 插入、删除和定位元素,最好选择HashMap
  • 如要按自然顺序或自定义顺序遍历键,TreeMap更好

使用HashMap要求添加的键类明确定义了hashCode()和 equals()的实现。
两个map中的元素一样,但顺序不一样,导致hashCode()不一样。
同样做测试:
在HashMap中,同样的值的map,顺序不同,equals时,false;
而在treeMap中,同样的值的map,顺序不同,equals时,true,说明,treeMap在equals()时是整理了顺序了的。

HashTable与HashMap

  • HashMap继承自AbstractMap类;HashTable继承自Dictionary类;
  • HashMap线程不安全;HashTable线程安全;
  • HashMap容量只能为2的幂,默认16,New一个HashMap容量至少为2,扩容二倍;HashTable容量任意,默认11,New一个HashTable容量可以为1,扩容二倍+1;
  • HashMap确定下标位运算,效率高;HashTable确定下标取余;
  • HashMap的Key允许一个null,value允许一个或者多个;HashTable的Key、Value不可以为null,否则会抛出NullPointerException异常;

 

一些关于Java集合的重要问题和答案:

1.使用集合框架的优点

(1)降低开发成本和维护成本

(2)提高代码质量

(3)复用性和可操作性

2.集合框架的泛型优点

  • 泛型允许我们为集合提供一个可以容纳的对象类型,因此,如果你添加其它类型的任何元素,它会在编译时报错。这避免了在运行时出现ClassCastException,因为你将会在编译时得到报错信息。
  • 泛型也使得代码整洁,我们不需要使用显式转换和instanceOf操作符。给运行时带来好处,因为不会产生类型检查的字节码指令。

3.Java集合框架的基础接口有哪些

  • Collection为集合层级的根接口
  • Set是一个有序不包含重复元素的集合
  • List是一个无序包含重复元素的集合
  • Map是一个将key映射到value的对象,不包含重复key,每个key最多只能映射一个value

4.为何Collection不从Cloneable和Serializable接口继承

    Collection接口指定一组对象,对象即为它的元素。如何维护这些元素由Collection的具体实现决定。例如,List实现允许重复的元素,而Set不允许。很多Collection实现有一个公有的clone方法。然而,把它放到集合的所有实现中也是没有意义的。这是因为Collection是一个抽象表现。重要的是实现。

    当与具体实现打交道的时候,克隆或序列化的语义和含义才发挥作用。所以,具体实现应该决定如何对它进行克隆或序列化,或它是否可以被克隆或序列化。

    在所有的实现中授权克隆和序列化,最终导致更少的灵活性和更多的限制。特定的实现应该决定它是否可以被克隆和序列化。

5.为何Map接口不继承Collection接口

    尽管Map接口和它的实现也是集合框架的一部分,但Map不是集合,集合也不是Map。因此,Map继承Collection毫无意义,反之亦然。

6.Iterator是什么

    Iterator接口提供遍历任何Collection的接口。我们可以从一个Collection中使用迭代器方法来获取迭代器实例。迭代器取代了Java集合框架中的Enumeration。迭代器允许调用者在迭代过程中移除元素。

7.Enumeration和Iterator接口的区别

Enumeration的速度是Iterator的两倍,使用更少的内存。Enumeration是非常基础的,也满足了基础的需要。但是,Iterator更加安全,因为当一个集合正在被遍历的时候,它会阻止其它线程去修改集合。

迭代器取代了Java集合框架中的Enumeration。迭代器允许调用者从集合中移除元素,而Enumeration做不到。

8.为何没有像Iterator.add()这样的方法,向集合中添加元素

    语义不明,已知的是,Iterator接口提供遍历任何Collection的接口。Iterator没有提供add操作,ListIterator提供add操作

9.为何迭代器没有一个方法可以直接获取下一个元素,而不需要移动游标

    它可以在当前Iterator的顶层实现,但是它用得很少,如果将它加到接口中,每个继承都要去实现它,这没有意义。

10.Iterater和ListIterator之间有什么区别

都是迭代器,当需要对集合中元素进行遍历不需要干涉其遍历过程时,这两种迭代器都可以使用

  • Iterator用来遍历所有集合,Set、List和Map和这些集合的子类型。而ListIterator只能用于List及其子类型
  • ListIterator除了遍历list外,还支持add和remove,Iterator只能遍历,尽管有remove,但是会抛异常
  • ListIterator和Iterator都有hasNext()和next()方法,可以实现顺序向后遍历,但ListIterator有hasPrevious()和previous()方法,可以实现逆向(顺序向前)遍历。Iterator不能
  • ListIterator中set()方法可以实现对象的修改,Iterator不能修改对象

11.遍历一个List有哪些不同的方式?

  • Iterator:迭代输出,使用最多
  • ListIterator:Iterator的子接口,专用于输出List
  • for循环
  • foreach输出:JDK1.5之后提供的新功能,可以输出数组或集合

    迭代器更加线程安全,因为它可以确保当遍历的集合元素被更改时,抛出ConcurrentModificationException异常。

12.通过迭代器fail-fast属性,你明白了什么

每次我们尝试获取下一个元素的时候,Iterator fail-fast属性检查当前集合结构里的任何改动。如果发现任何改动,它抛出ConcurrentModificationException。

Collection中所有Iterator的实现都是按fail-fast来设计的(ConcurrentHashMap和CopyOnWriteArrayList这类并发集合类除外)。

13.fail-fast与fail-safe有什么区别

  • Java.util中所有集合类都为fail-fast的。Iterator的fail-fast属性与当前的集合共同起作用,不会受集合任何改动影响。
  • java.util.concurrent中的集合类都为fail-safe的。fail-fast迭代器会抛出异常,而fail-safe迭代器从不抛出异常。

14.在迭代一个集合的时候,如何避免ConcurrentModificationException

    遍历集合时,可以使用并发集合类避免ConcurrentModificationException,比如CopyOnWriteArrayList而不是ArrayList。

15.为何Iterator接口没有具体的实现

Iterator接口定义了遍历集合的方法,但它的实现则是集合实现类的责任。每个能够返回用于遍历的Iterator的集合类都有它自己的Iterator实现内部类。

这就允许集合类去选择迭代器是fail-fast还是fail-safe的。比如,ArrayList是fail-fast的,而CopyOnWriteArrayList是fail-safe的。

16.UnsupportedOperationException是什么

UnsupportedOperationException用于表明操作不支持的异常。在JDK类中已被大量运用,在集合框架java.util.Collections.UnmodifiableCollection将会在所有add和remove操作中抛出这个异常。

17.hashCode()和equals()方法有何重要性

HashMap使用key的hashCode()和equals()方法去决定key-value对的索引。当我们从HashMap中获取值时,这些方法也会用到。

如果这些方法没有被正确地实现,在这种情况下,两个不同Key也许会产生相同的hashCode()和equals()输出,HashMap将会认为它们是相同的,然后覆盖它们,而非把它们存储到不同的地方。

所有不允许存储重复数据的集合类都使用hashCode()和equals()去查找重复,所以正确实现它们非常重要。equals()和hashCode()的实现应该遵循以下规则:

(1)如果   o1.equals(o2)   ,那么   o1.hashCode() == o2.hashCode()   总为   true

(2)如果   o1.hashCode() == o2.hashCode()   ,并不意味   o1.equals(o2)   为   true

18.能否使用任何类作为Map的key

    可以使用任何类作为Map的key,但需要考虑以下几点:

(1)如果类重写了equals()方法,它也应该重写hashCode()方法

(2)类的所有实例需要遵循与equals()和hashCode()相关的规则

(3)如果一个类没有使用equals(),你不应该在hashCode()中使用它。

(4)用户自定义key类的最佳实践是使之为不可变的,这样,hashCode()值可以被缓存起来,拥有更好的性能。不可变的类也可以确保hashCode()和equals()在未来不会改变,这样就会解决与可变相关的问题了。

比如:

//传递给MyKey的name参数被用于equals()和hashCode()中
MyKey key = new MyKey('Pankaj'); //assume hashCode=1234
myHashMap.put(key, 'Value');

// 以下代码会改变key的hashCode()和equals()值
key.setName('Amit'); //assume new hashCode=7890
//下面会返回null,因为HashMap会尝试查找存储同样索引的key,而key已被改变了,匹配失败,返回null
myHashMap.get(new MyKey('Pankaj'));
那就是为什么String, Interger这样的wrapper类适合作为键

19.Map接口提供了哪些不同的集合视图

    Map接口提供三个集合视图:

(1)keyset():返回map中包含的所有key的一个Set视图。

(2)values():返回一个map中包含的所有value的一个Collection视图。

(3)entrySet():返回一个map钟包含的所有映射的一个集合视图。

20.HashMap和HashTable有何不同

(1)HashMap继承自AbstractMap类;HashTable继承自Dictionary类

(2)HashMap线程不安全;HashTable线程安全

(3)HashMap容量只能为2的幂、默认16、New一个HashMap容量至少为2,扩容二倍;HashTable容量任意、默认11、New一个HashTable容量可以为1,扩容二倍+1

(4)HashMap确定下标位运算,效率高;HashTable确定下标取余

(5)HashMap的Key允许一个null,value允许一个或者多个;HashTable的Key、Value不可以为null,否则会抛出NullPointerException异常

21.如何决定选用HashMap还是TreeMap

(1)对于插入、删除和定位元素这类操作,HashMap是最好选择。

(2)对于遍历一个有序的key集合,TreeMap是更好选择。

22.ArrayList和Vector有何异同点

  相同点:

(1)基于索引的,内部是数组

(2)数据有序插入

(3)迭代器都是fail-fast的

(4)允许null值,使用索引值对元素进行随机访问

  不同点:

(1)Vector是同步,安全;ArrayList异步,不安全

(2)ArrayList效率高,因为Vector由于使用了synchronized修饰的方法

(3)vector扩容二倍,arraylist扩容1.5倍。如果在集合中使用数据量比较大的数据,用vector有优势

23.Array和ArrayList有何区别?什么时候更适合用Array

    Array可以容纳基本类型和对象,而ArrayList只能容纳对象。

    Array是指定大小的,而ArrayList大小是固定的。

    Array没有提供ArrayList那么多功能,比如addAll、removeAll和iterator等。尽管ArrayList明显是更好的选择,但也有些时候Array比较好用:

(1)如果列表的大小已经指定,大部分情况下是存储和遍历它们

(2)对于遍历基本数据类型

(3)如果使用多维数组,使用 [][] 比 List<List<>> 更容易

24.ArrayList和LinkedList有何区别

    ArrayList和LinkedList两者都实现了List接口,但是它们之间有些不同。

(1)ArrayList基于动态数组,LinkedList基于链表

(2)查询:ArrayList随机定位,比较快;LinkedList移动指针

(3)新增和删除:LinedList修改指针,比较快,ArrayList移动数据填补被删除对象的空间

(4)LinkedList比ArrayList消耗更多的内存,因为LinkedList中的每个节点存储了前后节点的引用

25.哪些集合类提供对元素的随机访问

    ArrayList、HashMap、TreeMap和HashTable类提供对元素的随机访问。

26.EnumSet是什么

    java.util.EnumSet是使用枚举类型的集合实现。当集合创建时,枚举集合中的所有元素必须来自单个指定的枚举类型,可以是显示的或隐示的。EnumSet是不同步的,不允许值为null的元素。它也提供了一些有用的方法,比如copyOf(Collection c)、of(E first,E…rest)和complementOf(EnumSet s)。

27.哪些集合类是线程安全的

    Vector、HashTable、Properties和Stack是同步类,所以是线程安全的,可以在多线程环境下使用。Java1.5并发API包括一些集合类,允许迭代时修改,因为它们都工作在集合的克隆上,所以它们在多线程环境中是安全的。

28.并发集合类是什么

    Java1.5并发包(java.util.concurrent)包含线程安全集合类,允许在迭代时修改集合。迭代器被设计为fail-fast的,会抛出ConcurrentModificationException。一部分类为:CopyOnWriteArrayList、 ConcurrentHashMap、CopyOnWriteArraySet。

29.BlockingQueue是什么

    Java.util.concurrent.BlockingQueue是一个队列,在进行检索或移除一个元素的时候,它会等待队列变为非空;当在添加一个元素时,它会等待队列中的可用空间。BlockingQueue接口是Java集合框架的一部分,主要用于实现生产者-消费者模式。我们不需要担心等待生产者有可用的空间,或消费者有可用的对象,因为它都在BlockingQueue的实现类中被处理了。Java提供了集中BlockingQueue的实现,比如ArrayBlockingQueue、LinkedBlockingQueue、PriorityBlockingQueue,、SynchronousQueue等。

30.队列和栈是什么,列出它们的区别

    栈和队列两者都被用来预存储数据。java.util.Queue是一个接口,它的实现类在Java并发包中。队列允许先进先出(FIFO)检索元素,但并非总是这样。Deque接口允许从两端检索元素。

栈与队列很相似,但它允许对元素进行后进先出(LIFO)进行检索。

    Stack是一个扩展自Vector的类,而Queue是一个接口。

31.Collections类是什么

    Java.util.Collections是一个工具类仅包含静态方法,它们操作或返回集合。它包含操作集合的多态算法,返回一个由指定集合支持的新集合和其它一些内容。这个类包含集合框架算法的方法,比如折半搜索、排序、混编和逆序等。

32.Comparable和Comparator接口是什么

    如果我们想使用Array或Collection的排序方法时,需要在自定义类里实现Java提供Comparable接口。Comparable接口有compareTo(T OBJ)方法,它被排序方法所使用。我们应该重写这个方法,如果“this”对象比传递的对象参数更小、相等或更大时,它返回一个负整数、0或正整数。但是,在大多数实际情况下,我们想根据不同参数进行排序。比如,作为一个CEO,我想对雇员基于薪资进行排序,一个HR想基于年龄对他们进行排序。这就是我们需要使用Comparator接口的情景,因为Comparable.compareTo(Object o)方法实现只能基于一个字段进行排序,我们不能根据对象排序的需要选择字段。Comparator接口的compare(Object o1, Object o2)方法的实现需要传递两个对象参数,若第一个参数比第二个小,返回负整数;若第一个等于第二个,返回0;若第一个比第二个大,返回正整数。

33.Comparable和Comparator接口有何区别

    Comparable和Comparator接口被用来对对象集合或者数组进行排序。Comparable接口被用来提供对象的自然排序,我们可以使用它来提供基于单个逻辑的排序。

    Comparator接口被用来提供不同的排序算法,我们可以选择需要使用的Comparator来对给定的对象集合进行排序。

34.我们如何对一组对象进行排序

  •     如果我们需要对一个对象数组进行排序,我们可以使用Arrays.sort()方法。
  •     如果我们需要排序一个对象列表,我们可以使用Collection.sort()方法。
  •     两个类都有用于自然排序(使用Comparable)或基于标准的排序(使用Comparator)的重载方法sort()。
  •     Collections内部使用数组排序方法,所有它们两者都有相同的性能,只是Collections需要花时间将列表转换为数组。

35.当一个集合被作为参数传递给一个函数时,如何才可以确保函数不能修改它

    在作为参数传递之前,我们可以使用Collections.unmodifiableCollection(Collection c)方法创建一个只读集合,这将确保改变集合的任何操作都会抛出UnsupportedOperationException。

36.我们如何从给定集合那里创建一个synchronized的集合

    我们可以使用Collections.synchronizedCollection(Collection c)根据指定集合来获取一个synchronized(线程安全的)集合。

37.集合框架里实现的通用算法有哪些

    Java集合框架提供常用的算法实现,比如排序和搜索。Collections类包含这些方法实现。大部分算法是操作List的,但一部分对所有类型的集合都是可用的。部分算法有排序、搜索、混编、最大最小值。

38.大写的O是什么?举几个例子

    大写的O描述的是,就数据结构中的一系列元素而言,一个算法的性能。Collection类就是实际的数据结构,我们通常基于时间、内存和性能,使用大写的O来选择集合实现。比如:

  • 例子1:ArrayList的get(index i)是一个常量时间操作,它不依赖list中元素的数量。所以它的性能是O(1)。
  • 例子2:一个对于数组或列表的线性搜索的性能是O(n),因为我们需要遍历所有的元素来查找需要的元素。

39.与Java集合框架相关的有哪些最好的实践

(1)根据需要选择正确的集合类型。比如,如果指定了大小,我们会选用Array而非ArrayList。如果我们想根据插入顺序遍历一个Map,我们需要使用TreeMap。如果我们不想重复,我们应该使用Set。

(2)一些集合类允许指定初始容量,所以如果我们能够估计到存储元素的数量,我们可以使用它,就避免了重新哈希或大小调整。

(3)基于接口编程,而非基于实现编程,它允许我们后来轻易地改变实现。

(4)总是使用类型安全的泛型,避免在运行时出现ClassCastException。

(5)使用JDK提供的不可变类作为Map的key,可以避免自己实现hashCode()和equals()。

(6)尽可能使用Collections工具类,或者获取只读、同步或空的集合,而非自己编写。提高代码重用性,稳定性和可维护性。


————————————————————————————————————————————————————————
 

本文在CSDN博主「心诚则灵--艾」的原创文章有所精简改动
原文链接:https://blog.csdn.net/u010775025/article/details/79315361

在大佬的基础上做了一些精简,更容易理解记忆,如果错误不当,欢迎下方评论,方便及时修改,避免误导他人。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值