Java集合类是一种特别有用的工具类,可用于存储数量不等的对象,并可实现常用的数据结构,如栈、队列等。除此之外,Java集合还可用于保存具有映射关系的关联数组。
Java集合大致可以分为Set、List、Map和Queue四种体系。
其中Set代表无序、不可重复的集合;
List 代表有序、可重复的集合;
Map 代表具有映射关系的集合;
Java 5又增加了Queue体系集合,代表一种队列集合的实现。
Java集合就像一种容器,可以把多个对象(实际上是对象的引用)“丢进”容器中。在Java 5之前,Java集合会丢失容器中所有对象的数据类型,把所有对象当成Object类型处理;从Java 5增加了泛型以后,Java 集合可以记住容器中对象的数据类型,从而可以编写出更简洁、更健壮的代码。
一、Java集合概述
在编程时,常常需要集中存放多个数据。可以使用数组来保存多个对象,但数组长度不可变化,一旦在初始化数组时指定了数组长度,这个数组长度就是不可变的,如果要保存数量可变的数据,数组就有点无能为力了;而且数组无法保存具有映射关系的数据,如成绩表:语文-90 ,数学-80。
为了保存数量不确定的数据,以及保存具有映射关系的数据(也被称为关联数组),Java提供了集合类,集合类主要负责保存、盛装其他数据。因此集合类也被称为容器类。所有集合类都位于java.util包下,后来为了处理多线程环境下并发安全问题,Java 5还在java.util.concurrent包下提供了一些多线程支持的集合类。
集合类和数组不一样,数组元素既可以是基本类型的值,也可以是对象;
而集合里只能保存对象。
Java的集合类主要由两个接口派生而出:Collection和Map,Collection和Map是Java集合框架的根接口,这两个接口又包含了一些子接口或实现类。
Set和List接口是Collection接口派生出的两个子接口,它们分别代表了无序集合和有序集合;Queue是Java提供的队列实现,有点类似于List。
所有的Map实现类用于保存具有映射关系的数据,Map接口有众多实现类,这些实现类在功能、用法上存在一定差异,但它们都有一个功能特征:Map保存的每项数据都是key-value对。key是不可重复的。
根据这4个接口,可以把Java所有集合分成三类,
其中Set集合类似于一个罐子,把一个对象添加到Set集合时,Set集合无法记住这个元素的顺序,所以Set里的元素不能重复(否则系统无法准确识别这个因素),
List集合非常像一个数组,它可以记住每次添加元素的顺序,且List的长度可变。
Map集合也像一个罐子,只是它里面的每项数据都由两个值组成。
如果访问List集合里的元素,可以直接根据索引来访问;
如果访问Map集合里的元素,可以根据key来访问其value;
如果访问Set集合里的元素,则只能根据元素本身来访问(这也是Set集合元素不允许重复的原因)。
二、Collection和Iterator接口
Collection是List、Set和Queue接口的父接口。该接口里定义的方法可用于操作Set集合,也可以用于操作List和Queue集合。Collection接口定义了如下操作集合元素的方法。
- boolean add(Object o):用于向集合里添加一个元素
- boolean addAll(Collection c):该方法把集合c里所有元素添加到指定集合中。
- void clear():清楚集合里所有元素,将集合变为0。
- boolean contains(Object o)
- boolean containsAll(Collection c)
- boolean isEmpty()
- boolean remove()
- boolean removeAll()
- Iterator iterator():返回一个Iterator对象,用于遍历集合里的元素
- int size():该方法返回集合里的元素
- Object[] toArray():该方法把集合转换成一个数组,所有集合元素变成数组元素。
下面程序示范了如何通过上面的方法来操作Collection集合里的元素。
public class CollectionTest {
public static void main(String[] args) {
Collection c = new ArrayList();
//添加元素
c.add("张三");
//虽然集合不能放节本类型的值,但Java支持自动装箱
c.add(6);
System.out.println("c的集合元素个数为:" + c.size());//输出2
//删除指定元素
c.remove(6);
System.out.println("c的集合元素个数为:" + c.size());//输出1
//判断是否包含指定字符串
System.out.println("c集合是否包含\"张三\"字符串:" +
c.contains("张三"));//输出true
c.add("高等数学");
System.out.println("c集合的元素:" + c);
Collection books = new HashSet();
books.add("高等数学");
books.add("通信原理");
System.out.println("c集合是否完全包含books集合?" +
c.containsAll(books));//输出false
//用c集合减去books集合里的元素
c.removeAll(books);
System.out.println("c集合里的元素:" + c);
//删除c里面的所有元素
c.clear();
System.out.println("c集合的元素" + c);
//控制books集合里只剩下c集合里也包含的元素
books.retainAll(c);
System.out.println("books集合的元素:"+books);
}
}
上面程序创建了两个Collection对象,一个是c集合,一个是books集合,其中c集合是ArrayList,而books集合是HashSet。虽然它们使用的实现类不同,但把它们当成Collection来使用时,使用add、remove、clear等方法来操作集合元素时没有任何区别。
当使用System.out的println()方法来输出集合对象时,将输出[ele1,ele2 ,…]的形式,这显然是因为所有的Collection实现类都重写了toString()方法,该方法可以一次性地输出集合中的元素。
如果想依次访问集合里的每一元素,则需要使用某种方式遍历集合元素,下面介绍遍历结合元素的两种方法。
注意:在传统模式下,也就是刚刚我们使用的方式,把一个对象“丢进”集合中后,集合会忘记这个对象的类型——也就是说,系统把所有的集合元素都当成Object类型。从JDK1.5以后,这种状态得到了改进,可以使用泛型来限制集合里的元素的类型。
1.使用Lambda表达式遍历集合
Java 8为Iterable接口新增了一个forEach(Consumer action)默认方法,该方法所需参数的类型是一个函数式接口,而Iterable接口是Collection接口的父接口,因此Collection集合也可直接调用该方法。
当程序调用Iterable的forEach(Consumer action)遍历集合元素时,程序会一次将集合元素传给Consumer的accept(T t)方法(该接口中唯一的抽象方法)。正因为Consumer是函数式接口,因此可以使用Lambda表达式来遍历集合元素。
下面程序示范了使用Lambda表达式来遍历集合元素。
public class CollectionEach {
public static void main(String[] args) {
//创建一个集合
Collection books = new HashSet();
books.add("高等数学");
books.add("大学物理");
books.add("概率论与数理统计");
//调用forEach()方法遍历集合
books.forEach(obj -> System.out.println(obj));
}
}
上面程序中的粗体字代码调用了Iterable的forEach()默认方法来遍历集合元素,传给该方法的参数是一个Lambda表达式,该Lambda表达式的目标类型是Comsumer。forEach()方法会自动将集合元素逐个传给Lambda表达式的形参,这样Lambda表达式的代码体即可遍历到集合元素了。
2.使用Java 8增强的Iterator遍历集合元素
Iterator接口也是Java集合框架的成员,但它与Collection系列、Map系列的集合不一样,Collection系列、Map系列主要用于盛装其他对象,而Iterator主要用于遍历(即迭代访问)Collection集合中的元素,Iterator也被称为迭代器。
Iterator接口隐藏了各种Collection实现类的底层细节,向应用程序提供了遍历Collection集合元素的统一编程接口。Iterator接口里定义了如下4个方法。
- boolean hasNext():如果被迭代的集合元素还没有被遍历完,则返回true
- Object next():返回集合里下一个元素
- void remove():删除集合里的下一个元素
- void forEachRemaining(Consumer action),这是Java 8为Iterator新增的默认方法,该方法可使用Lambda表达式来遍历元素。
下面程序示范了提供Iterator接口来遍历集合元素。
public class IteratorTest
{
public static void main(String[] args) {
//创建一个集合
Collection books = new HashSet();
books.add("高等数学");
books.add("大学物理");
books.add("概率论与数理统计");
//获取books集合的Iterator
Iterator it = books.iterator();
while(it.hasNext())
{
//it.next()方法返回的数据类型是Object类型
//因此需要强制类型转换
String book = (String)it.next();
System.out.println(book);
if(book == "大学物理")
{
//从集合中删除上一次next()方法返回的元素
it.remove();
}
//对book遍历赋值,不会改变集合元素本身
book = "测试字符串";//①
}
System.out.println(books);
}
}
从上面代码可以看出,Iterator仅用于遍历集合,Iterator本身并不提供盛装对象的能力。如果要创建Iterator对象,则必须有一个被迭代的集合。没有集合的Iterator仿佛无本之木,没有存在的价值。
注意:
Iterator必须依附于Collection对象,若有一个Iterator对象,则必然有一个与之关联的Collcection对象。Iterator提供了两个方法来迭代访问Collection集合里的元素,并可通过remove()方法来删除集合中上一次next()返回的集合元素。
上面程序中①处代码对迭代变量book进行赋值,但再次输出books集合时,会看到集合里元素没有任何改变。这就可以得到一个结论:当使用Iterator对集合进行迭代时,Iterator并不是把集合元素本身传给迭代变量,而是把集合元素的值传给了迭代变量,所以修改迭代变量的值没有任何意义。
当使用Iterator迭代访问Collection集合元素时,Collection集合里的元素不能被改变,只有通过Iterator()方法删除上一次next()方法返回的集合元素才可以;否则将会引发java.util.ConcurrentModificationException异常。
public class IteratorErrorTest{
public static void main(String[] args)
{
//创建一个集合
Collection books = new HashSet();
books.add("高等数学");
books.add("大学物理");
books.add("概率论与数理统计");
//获取books集合的Iterator
Iterator it = books.iterator();
while(it.hasNext())
{
//it.next()方法返回的数据类型是Object类型
//因此需要强制类型转换
String book = (String)it.next();
System.out.println(book);
if(book == "大学物理")
{
//疏通Iterator迭代过程中,不可修改集合元素
//下面代码引发异常
books.remove(book);//①
}
}
System.out.println(books);
}
}
上面①号代码位于Iterator迭代块内,也就是Iterator迭代Collection集合过程中修改了Collection集合,所以程序将在运行时引发异常。
Iterator迭代器采用的是快速失败(fast-fail)机制,一旦在迭代过程中检测到该集合已经被修改(通长是程序中的其他线程修改),程序立刻引发ConcurrentModificationException异常,而不是修改后的结果,这样可以避免共享资源而引发的潜在问题。
注意:如果改为删除”高等数学”字符串,则不会引发异常。实际上这是一种危险的行为:对于HashSet以及后面的ArrayList等,迭代删除元素都会导致异常——只有在删除集合中特定元素时才不会抛出异常,这是由集合类的实现代码决定的,我们不应该这样做。
3.使用Lambda表达式遍历Iterator
Java 8为Iterator新增了一个forEachRemaining(Consumer action)方法,该方法所需的Consumer参数同样也是函数式接口。
下面示范使用Lambda表达式来遍历集合元素。
public class IteratorEach
{
public static void main(String[] args)
{
//创建一个集合
Collection books = new HashSet();
books.add("高等数学");
books.add("大学物理");
books.add("概率论与数理统计");
//获取books集合的Iterator
Iterator it = books.iterator();
//使用Lambda表达式来遍历集合元素
it.forEachRemaining(obj -> System.out.println(obj));
}
}
4.使用foreach循环遍历集合元素
除了使用Iterator接口迭代访问Collection集合里的元素之外,使用Java 5提供的foreach循环迭代访问集合元素更加便捷,如下使用了foreach循环来迭代访问集合元素。
public class ForeachTest
{
public static void main(String[] args)
{
//创建一个集合
Collection books = new HashSet();
books.add("高等数学");
books.add("大学物理");
books.add("概率论与数理统计");
//使用foreach循环来迭代访问集合元素
for(Object obj : books)
{
//此处的book变量也比集合元素本身
String book = (String)obj;
System.out.println(book);
if(book.equals("大学物理"))
{
//下面会引发ConcurrentModification异常
books.remove(book);//①
}
}
System.out.println(books);
}
}
上面代码使用foreach循环来迭代访问Collection集合里的元素更加简洁,这正是JDK1.5的foreach循环带来的优势。与使用Iterator接口迭代访问集合元素类似的,foreach循环中的迭代变量也不是集合元素本身,系统只是依次把集合元素的值赋给迭代变量。
同样,使用foreach循环迭代访问元素时,该集合也不能被改变,否则会引发异常。所以上面代码①处引发异常。