文章目录
七、Java集合
Java 集合类是一种工具类,可用于存储数量不等的对象,并可以实现常用的数据结构,如栈、队列等。除此之外,Java 集合还可以保存具有映射关系的关联数组。Java 集合大致可分为 Set、List、Queue 和 Map 四种体系。其中 Set 代表无序、不可重复的集合;List 代表有序、重复的集合;而 Map 则代表具有映射关系的集合;Java 5 中新增的 Queue 集合代表队列集合。
Java 集合就像一个容器,可以把多个对象(实际上是对象的引用)放进容器中,Java 5 之前会丢失容器中所有对象点的数据类型,把所有对象都当成 Object 类型处理;从 Java 5 增加泛型以后,Java 集合可以记住容器中对象的数据类型,从而可以编写出更简洁、健壮的代码。
7.1 Java集合概述
为了保存数据不确定的数据,以及保存具有映射关系的数据(也被称为关联数组),Java 提供了集合类,集合类主要负责保存、承装其他数据,因此集合类也被称为容器类。所有的集合类都位于 java.uti 包下,后来为了处理多线程环境下的并发安全问题,Java 5 还在 java.util.concurrent 包下提供了一些多线程支持的集合类。
集合类和数组不一样,数组元素既可以是基本类型的值,也可以是对象(实际保存的是对象的引用变量);而集合里只能保存对象。Java 集合类中主要由两个接口派生而出:Collection 和 Map,Collection 和 Map 是 Java 集合框架的根接口,这两个接口又包含了一些子接口和实现类。
其中 Set 和 List 接口是 Collection 接口派生的两个子接口,它们分别代表了无序集合和有序集合;Queue 是 Java 提供的队列实现。
所有的 Map 实现类用于保存具有映射关系的数据,即每项数据都是 key-value 对,Map 中的 key 是不可重复的,用于标识集合里的每项数据,如果需要查询 Map 中的数据时,总是根据 Map 的 key 来获取。
Java 集合可以分为三大类:Set 集合类似一个罐子,把一个对象添加到 Set 集合时,Set 集合无法记住添加这个元素的顺序,所以 Set 里的元素不能重复(否则系统无法准确识别);List 集合则类似数组,可以记住每次添加元素的顺序,且 List 的长度可变。Map 集合也像一个罐子,只是里面的每项数据都由两个值组成。常见的实现类有HashSet
、TreeSet
、ArrayList
、ArrayDeque
、LinkedList
和HashMap
、TreeMap
等实现类。
如果访问 List 集合中的元素,可以直接根据元素的索引来访问;入库过访问 Map 集合中的元素,可以根据每项元素的 key 来访问其 value;如果访问 Set 集合中的元素,则只能根据元素本身来访问(这也是 Set 集合里的元素不允许重复的原因)。
7.2 Collection 和 Iterator
Collection 接口是 List、Set 和 Queue 的父接口,该接口内定义的方法可用于操作 Set、LIst 和 Queue 集合。
- boolean add(Object o):该方法用于向集合里添加一个元素。如果集合对象被添加操作改变了,则返回 true;
- boolean addAll(Collection c):该方法把集合 c 里的所有元素添加到指定集合里。如果集合对象被添加操作改变了,则返回 true;(并集)
- void clear():清除集合里的所有元素,将集合长度变为 0;
- boolean contains(object o):返回集合里是否包含指定元素;
- boolean containsAll(Collection c):返回集合里是否包含集合 c 里的所有元素;
- boolean isEmpty():返回集合是否为空,当集合长度为 0 时返回 true,否则返回 false;
- Iterator iterator():返回一个 Iterator 对象,用于遍历集合里的元素;
- boolean remove(Object o):删除集合中指定元素 o,当集合中包含一个或多个元素 o 时,该方法只删除第一个符合条件的元素,该方法将返回 true;
- boolean removeAll(Collection c):从集合中删除集合 c 里包含的所有元素(相当于调用该方法的集合减去集合 c),如果删除了一个或多个元素,则该方法返回 true;(差集)
- boolean retainAll(Collection c):从集合中删除集合 c 里不包含的元素,如果该操作改变了调用该方法的集合,则该方法返回 true;(交集)
- int size():该方法返回集合里元素的个数;
- Object[] toArray:该方法把集合转换成一个数组,所有的集合元素变成对应的数组元素;
public class CollectionTest {
public static void main(String[] args) {
Collection c = new ArrayList();
//添加元素
c.add("Java编程思想");
//虽然集合中不能放基本类型的值,但Java支持自动装箱
c.add(66);
System.out.println("c集合中元素个数为" + c.size());//输出2
c.remove(66);
System.out.println("c集合中元素个数为" + c.size());//输出1
//判断是否包含指定字符串
System.out.println(c.contains("Java编程思想"));//输出true
System.out.println(c);
Collection books = new HashSet();
books.add("Java编程思想");
books.add("Java核心技术卷");
System.out.println("books集合是否包含c集合:" + c.containsAll(c));//输出true
//用books集合减去c集合
books.removeAll(c);
System.out.println(books);
//删除c集合所有元素
c.clear();
System.out.println(c);
//控制books集合中值保留c中也包含的元素
books.retainAll(c);
System.out.println(books);
}
}
上面程序创建了两个 Collection 对象,一个是 c 集合,一个是 books 集合,其中 c 集合是 ArrayList,而 books 集合是 HashSet。虽然实现类不同,但当成 Collection 使用 add、remove 等方法并没有区别。所有的 Collection 实现类都重写了 toString 方法,该方法可以一次性输出集合中的所有元素。
在传统模式下,把一个对象丢进集合中后,集合会忘记这个对象的类型,也就是说系统会把所有的集合元素都当成 Object 类型。在 JDK 1.5 以后,可以使用泛型来限制集合里元素的类型,并让集合记住所有集合元素的类型。
7.2.1 使用Lambda表达式遍历集合
Java 8 为 Iterator 接口新增了一个forEach(Consumer action)
默认方法,该方法所需的类型是一个函数式接口,而 Iterable 接口是 Collection 接口的父接口,因此 Collection 集合也可以直接调用该方法。当程序调用 Iterable 的forEach(Consumer action)
遍历集合元素,程序会依次将集合元素传给 Consumer 的accept(T t)
方法(该接口中的唯一抽象方法)。正因为 Consumer 是函数式接口,因此可以使用 Lambda 接口表达式来遍历集合元素。
Collection book = new HashSet();
book.add("Java");
book.add("JVM");
book.forEach(obj -> System.out.println("迭代集合元素:" + obj));
7.2.2 使用 Java 8 增强的Iterator遍历集合元素
Iterator 接口也是 Java 集合框架的成员,但它与 Collection系列、Map 系列的集合不一样:Collection 系列集合、Map 系列集合主要用于盛装其他对象,而 Iterator 主要用于遍历(即迭代访问)Collection 集合中的元素,Iterator 对象也被称为迭代器。Iterator 接口隐藏了各种 Collection 实现类的底层细节,向应用程序提供了遍历 Collection 集合元素的统一编程接口。
- boolean hasNext():如果被迭代的集合元素还没有被遍历完,则返回 true;
- Object next():返回集合里的下一个元素;
- void remove():删除集合里的上一次 next 方法返回的元素;
- void forEachRemaining(Consumer action):Java 8 新增的默认方法,可以使用 Lambda表达式遍历整个集合;
public class IteratorTest {
public static void main(String[] args) {
Collection books = new HashSet();
books.add("Java");
books.add("JVM");
books.add("JRE");
Iterator it = books.iterator();
while (it.hasNext()) {
//it.next()方法返回的数据类型是Object类型,因此需要强制类型转换
String book = (String) it.next();
System.out.println("直接打印:" + book);
if (book.equals("JVM")) {
//从集合中删除上一次next()方法返回的元素
it.remove();
}
//对剩余(Remaining)的元素进行循环处理(forEach)。
// forEachRemaining方法接受一个Consumer参数表示循环体执行的内容,针对每个元素会执行的方法,所以参数名叫action
//调用完毕后迭代器中不再有下一个元素,退出了while循环
it.forEachRemaining(obj -> System.out.println(obj));
//只能调用一次,第二次将不会有任何输出
it.forEachRemaining(obj -> System.out.println(obj));
//对book变量赋值不会改变集合元素本身
book = "测试字符串";
}
System.out.println(books);
}
}
Iterator 仅用于遍历集合,Iterator 本身并不提供盛装对象的能力,如果需要创建 Iterator 对象,则必须由一个迭代集合。
Iterator 必须依附于 Collection 对象,若有一个 Iterator 对象,则必然有一个与之相关联的 Collection 对象。Iterator 提供了两个方法来迭代访问 Collection 集合里的元素。
当使用 Iterator 迭代访问 Collection 集合元素时,Collection 集合里的元素不能被改变,只有通过 Iterator 的remove()
方法删除上一次next()
方法返回集合元素才可以,否则会引发java.util.ConcurrentModificatonException
异常。Iterantor 迭代器采用的是快速失败 (fail-fast)机制,一旦在迭代过程中检测到该集合已经被修改(通常是被程序中其他线程修改),程序立即引发异常,而不是显示修改后的结果,这样可以避免共享资源而引发的潜在问题。
7.2.3 使用foreach循环遍历集合元素
foreach 循环迭代访问 Collection 集合里的元素更加简洁,其内部实现原理也是通过 Iterator 实现的,只不过是 Java 编译器自动完成的,但因为每次需要做类型转换检查,因此花费时间比 Iterator 略长,但时间复杂度与 Iterator 一样。foeach 循环中的迭代变量也不是集合元素本身,系统只是依次把集合元素的值赋给迭代变量,因此在 foreach 循环中修改迭代变量的值没有任何实际意义。同样,在使用 f