说明:先从整体介绍了Java集合框架包含的接口和类,然后总结了集合框架中的一些基本知识和关键点,并结合实例进行简单分析。
1、综述
所有集合类都位于java.util包下。集合中只能保存对象(保存对象的引用变量)。(数组既可以保存基本类型的数据也可以保存对象)。
当我们把一个对象放入集合中后,系统会把所有集合元素都当成Object类的实例进行处理。从JDK1.5以后,这种状态得到了改进:可以使用泛型来限制集合里元素的类型,并让集合记住所有集合元素的类型(参见具体泛型的内容)。
Java的集合类主要由两个接口派生而出:Collection和Map,Collection和Map是Java集合框架的根接口,这两个接口又包含了一些接口或实现类。
Set和List接口是Collection接口派生的两个子接口,Queue是Java提供的队列实现,类似于List。
Map实现类用于保存具有映射关系的数据(key-value)。
Set、List和Map可以看做集合的三大类。
List集合是有序集合,集合中的元素可以重复,访问集合中的元素可以根据元素的索引来访问。
Set集合是无序集合,集合中的元素不可以重复,访问集合中的元素只能根据元素本身来访问(也是不能集合里元素不允许重复的原因)。
Map集合中保存Key-value对形式的元素,访问时只能根据每项元素的key来访问其value。
对于Set、List和Map三种集合,最常用的实现类分别是HashSet、ArrayList和HashMap三个实现类。(并发控制的集合类,以后有空研究下)。
2、Collection接口
Collection接口是List、Set和Queue接口的父接口,同时可以操作这三个接口。
Collection接口定义操作集合元素的具体方法大家可以参考API文档,这里通过一个例子来说明Collection的添加元素、删除元素、返回集合中元素的个数以及清空集合元素的方法。
- public class TestCollection
- {
- public static void main(String[] args)
- {
- Collection c = new ArrayList();
- //添加元素
- c.add("孙悟空");
- //虽然集合里不能放基本类型的值,但Java支持自动装箱
- c.add(6);
- System.out.println("c集合的元素个数为:" + c.size());
- //删除指定元素
- c.remove(6);
- System.out.println("c集合的元素个数为:" + c.size());
- //判断是否包含指定字符串
- System.out.println("c集合的是否包含孙悟空字符串:" + c.contains("孙悟空"));
- c.add("轻量级J2EE企业应用实战");
- System.out.println("c集合的元素:" + c);
- Collection books = new HashSet();
- books.add("轻量级J2EE企业应用实战");
- books.add("Struts2权威指南");
- System.out.println("c集合是否完全包含books集合?" + c.containsAll(books));
- //用c集合减去books集合里的元素
- c.removeAll(books);
- System.out.println("c集合的元素:" + c);
- //删除c集合里所有元素
- c.clear();
- System.out.println("c集合的元素:" + c);
- //books集合里只剩下c集合里也同时包含的元素
- books.retainAll(c);
- System.out.println("books集合的元素:" + books);
- }
- }
public class TestCollection
{
public static void main(String[] args)
{
Collection c = new ArrayList();
//添加元素
c.add("孙悟空");
//虽然集合里不能放基本类型的值,但Java支持自动装箱
c.add(6);
System.out.println("c集合的元素个数为:" + c.size());
//删除指定元素
c.remove(6);
System.out.println("c集合的元素个数为:" + c.size());
//判断是否包含指定字符串
System.out.println("c集合的是否包含孙悟空字符串:" + c.contains("孙悟空"));
c.add("轻量级J2EE企业应用实战");
System.out.println("c集合的元素:" + c);
Collection books = new HashSet();
books.add("轻量级J2EE企业应用实战");
books.add("Struts2权威指南");
System.out.println("c集合是否完全包含books集合?" + c.containsAll(books));
//用c集合减去books集合里的元素
c.removeAll(books);
System.out.println("c集合的元素:" + c);
//删除c集合里所有元素
c.clear();
System.out.println("c集合的元素:" + c);
//books集合里只剩下c集合里也同时包含的元素
books.retainAll(c);
System.out.println("books集合的元素:" + books);
}
}
程序输出结果:
c集合的元素个数为:2
c集合的元素个数为:1
c集合的是否包含孙悟空字符串:true
c集合的元素:[孙悟空, 轻量级J2EE企业应用实战]
c集合是否完全包含books集合?false
c集合的元素:[孙悟空]
c集合的元素:[]
books集合的元素:[]
3、两种遍历集合的方法Iterator接口和foreach循环
1、Iterator接口
Iterator也是Java集合框架的成员,主要用于遍历(即迭代访问)Collection集合中的元素,也称为迭代器。
提供的三种方法:
boolean hasNext():返回集合里的下一个元素。
Object next():返回集合里下一个元素。
void remove();删除集合里上一次next方法返回的元素。
- public class TestIterator
- {
- public static void main(String[] args)
- {
- //创建一个集合
- Collection books = new HashSet();
- books.add("轻量级J2EE企业应用实战");
- books.add("Struts2权威指南");
- books.add("基于J2EE的Ajax宝典");
- //获取books集合对应的迭代器
- Iterator it = books.iterator();
- while(it.hasNext())
- {
- //未使用泛型,需要强制转换
- String book = (String)it.next();
- System.out.println(book);
- if (book.equals("Struts2权威指南"))
- {
- it.remove();
- //使用Iterator迭代过程中,不可修改集合元素,下面代码引发异常
- //books.remove(book);
- }
- //对book变量赋值,不会改变集合元素本身
- book = "测试字符串";
- }
- System.out.println(books);
- }
- }
public class TestIterator
{
public static void main(String[] args)
{
//创建一个集合
Collection books = new HashSet();
books.add("轻量级J2EE企业应用实战");
books.add("Struts2权威指南");
books.add("基于J2EE的Ajax宝典");
//获取books集合对应的迭代器
Iterator it = books.iterator();
while(it.hasNext())
{
//未使用泛型,需要强制转换
String book = (String)it.next();
System.out.println(book);
if (book.equals("Struts2权威指南"))
{
it.remove();
//使用Iterator迭代过程中,不可修改集合元素,下面代码引发异常
//books.remove(book);
}
//对book变量赋值,不会改变集合元素本身
book = "测试字符串";
}
System.out.println(books);
}
}
程序运行结果:
Struts2权威指南
基于J2EE的Ajax宝典
轻量级J2EE企业应用实战
[基于J2EE的Ajax宝典, 轻量级J2EE企业应用实战]
说明:
(1)通过语句“book = "测试字符串"; ”对迭代变量book进行赋值时,当我们再次输出books集合时,集合里的元素没有任何变化。即当使用Iterator对集合元素进行迭代时,Iterator并不是把集合元素本身传给迭代变量,而是把集合元素的值传给了迭代变量。
(2)当使用Iterator来访问Collection集合元素时,只有通过Iterator的remove方法删除(it.remove();)上一次next方法返回的集合元素才可以给集合中添加元素(book = "测试字符串"; )。否则引发java.util.ConcurrentModificationExcption异常。
2、使用foreach循环遍历集合元素。
格式:for(元素类型 t 元素变量 x : 遍历对象A) {
// 程序块
}
说明:
(1)foreach简化了对数组和集合的遍历,如果不希望遍历整个集合,或者在循环内部需要操作下标值就需要使用传统的for循环。
(2)简化了编程,提高了代码的可读性和安全性(不用怕数组越界)。
(3)foreach一般结合泛型使用
实例应用:
- public class TestArray {
- public static void main(String args[]) {
- TestArray test = new TestArray();
- test.test1();
- test.listToArray();
- test.testArray3();
- }
- /**
- * foreach语句输出一维数组
- */
- public void test1() {
- // 定义并初始化一个数组
- int arr[] = { 2, 3, 1 };
- System.out.println("----1----排序前的一维数组");
- for (int x : arr) {
- System.out.println(x); // 逐个输出数组元素的值
- }
- // 对数组排序
- Arrays.sort(arr);
- // 利用java新特性for each循环输出数组
- System.out.println("----1----排序后的一维数组");
- for (int x : arr) {
- System.out.println(x); // 逐个输出数组元素的值
- }
- }
- /**
- * 集合转换为一维数组
- */
- public void listToArray() {
- // 创建List并添加元素
- List<String> list = new ArrayList<String>();
- list.add("1");
- list.add("3");
- list.add("4");
- // 利用froeach语句输出集合元素
- System.out.println("----2----froeach语句输出集合元素");
- for (String x : list) {
- System.out.println(x);
- }
- // 将ArrayList转换为数组
- Object s[] = list.toArray();
- // 利用froeach语句输出集合元素
- System.out.println("----2----froeach语句输出集合转换而来的数组元素");
- for (Object x : s) {
- System.out.println(x.toString()); // 逐个输出数组元素的值
- }
- }
- /**
- * foreach输出二维数组测试
- */
- public void testArray2() {
- int arr2[][] = { { 4, 3 }, { 1, 2 } };
- System.out.println("----3----foreach输出二维数组测试");
- for (int x[] : arr2) {
- for (int e : x) {
- System.out.println(e); // 逐个输出数组元素的值
- }
- }
- }
- /**
- * foreach输出三维数组
- */
- public void testArray3() {
- int arr[][][] = { { { 1, 2 }, { 3, 4 } }, { { 5, 6 }, { 7, 8 } } };
- System.out.println("----4----foreach输出三维数组测试");
- for (int[][] a2 : arr) {
- for (int[] a1 : a2) {
- for (int x : a1) {
- System.out.println(x);
- }
- }
- }
- }
- }
public class TestArray {
public static void main(String args[]) {
TestArray test = new TestArray();
test.test1();
test.listToArray();
test.testArray3();
}
/**
* foreach语句输出一维数组
*/
public void test1() {
// 定义并初始化一个数组
int arr[] = { 2, 3, 1 };
System.out.println("----1----排序前的一维数组");
for (int x : arr) {
System.out.println(x); // 逐个输出数组元素的值
}
// 对数组排序
Arrays.sort(arr);
// 利用java新特性for each循环输出数组
System.out.println("----1----排序后的一维数组");
for (int x : arr) {
System.out.println(x); // 逐个输出数组元素的值
}
}
/**
* 集合转换为一维数组
*/
public void listToArray() {
// 创建List并添加元素
List<String> list = new ArrayList<String>();
list.add("1");
list.add("3");
list.add("4");
// 利用froeach语句输出集合元素
System.out.println("----2----froeach语句输出集合元素");
for (String x : list) {
System.out.println(x);
}
// 将ArrayList转换为数组
Object s[] = list.toArray();
// 利用froeach语句输出集合元素
System.out.println("----2----froeach语句输出集合转换而来的数组元素");
for (Object x : s) {
System.out.println(x.toString()); // 逐个输出数组元素的值
}
}
/**
* foreach输出二维数组测试
*/
public void testArray2() {
int arr2[][] = { { 4, 3 }, { 1, 2 } };
System.out.println("----3----foreach输出二维数组测试");
for (int x[] : arr2) {
for (int e : x) {
System.out.println(e); // 逐个输出数组元素的值
}
}
}
/**
* foreach输出三维数组
*/
public void testArray3() {
int arr[][][] = { { { 1, 2 }, { 3, 4 } }, { { 5, 6 }, { 7, 8 } } };
System.out.println("----4----foreach输出三维数组测试");
for (int[][] a2 : arr) {
for (int[] a1 : a2) {
for (int x : a1) {
System.out.println(x);
}
}
}
}
}
程序运行结果:
----1----排序前的一维数组
2
3
1
----1----排序后的一维数组
1
2
3
----2----froeach语句输出集合元素
1
3
4
----2----froeach语句输出集合转换而来的数组元素
1
3
4
----4----foreach输出三维数组测试
1
2
3
4
5
6
7
8
感想:
这篇先写到这里,后续文章将会介绍其余集合接口和类的详细知识。
这是自己写博客的第一篇文章,虽然很多内容都是借鉴高手的,但是从他们的字里行间可以看出他们对技术的痴迷和研究的深入。
我从接触Java到现在也就一年多时间,我深深被Java的一些程序表达方式所吸引。感觉它的语言风格更接近我们自然语言的表述。
在程序中表达自己的思想何尝不是一件畅事。
虽然断断续续的自学了一些Java知识,现在也可以看懂Java的大部分代码,但是要是自己去写出那些高深的代码,感觉还是有些棘手。
听大师说,语言是用来思考的。
要是学会了用Java语言进行思考,那么一定可以小有所成。
现在给自己制定了一个计划,就是从写博客来提高自己学习Java的积极性。
首先是一些基础知识的总结,结合一些实例表明知识的应用。
我想这会持续很久,也是考验自己,提高自己的好机会。
正如我的博客标题,用代码阐释人生的哲学,从代码中领悟人生,看清世事。
祝福每个奋斗在Java中的人们都可以找到最真的自己。
文章中代码和部分内容来源于《疯狂Java讲义》,如需转载,请注明出处。谢谢。
1、Set接口的使用
Set集合里多个对象之间没有明显的顺序。具体详细方法请参考API文档(可见身边随时带上API文档有多重要),基本与Collection方法相同。只是行为不同(Set不允许包含重复元素)。
Set集合不允许重复元素,是因为Set判断两个对象相同不是使用==运算符,而是根据equals方法。即两个对象用equals方法比较返回true,Set就不能接受两个对象。
- public class TestSet
- {
- public static void main(String[] args)
- {
- Set<String> books = new HashSet<String>();
- //添加一个字符串对象
- books.add(new String("Struts2权威指南"));
- //再次添加一个字符串对象,
- //因为两个字符串对象通过equals方法比较相等,所以添加失败,返回false
- boolean result = books.add(new String("Struts2权威指南"));
- System.out.println(result);
- //下面输出看到集合只有一个元素
- System.out.println(books);
- }
- }
public class TestSet { public static void main(String[] args) { Set<String> books = new HashSet<String>(); //添加一个字符串对象 books.add(new String("Struts2权威指南")); //再次添加一个字符串对象, //因为两个字符串对象通过equals方法比较相等,所以添加失败,返回false boolean result = books.add(new String("Struts2权威指南")); System.out.println(result); //下面输出看到集合只有一个元素 System.out.println(books); } }
程序运行结果:
false
[Struts2权威指南]
说明:程序中,book集合两次添加的字符串对象明显不是一个对象(程序通过new关键字来创建字符串对象),当使用==运算符判断返回false,使用equals方法比较返回true,所以不能添加到Set集合中,最后只能输出一个元素。
Set接口中的知识,同时也适用于HashSet、TreeSet和EnumSet三个实现类。
2、HashSet类
HashSet按Hash算法来存储集合的元素,因此具有很好的存取和查找性能。
HashSet的特点:
(1)HashSet不是同步的,多个线程访问是需要通过代码保证同步
(2)集合元素值可以使null。
HashSet集合判断两个元素相等的标准是两个对象通过equals方法比较相等,并且两个对象的hashCode()方法返回值也相等。
//类A的equals方法总是返回true,但没有重写其hashCode()方法
- class A
- {
- public boolean equals(Object obj)
- {
- return true;
- }
- }
- //类B的hashCode()方法总是返回1,但没有重写其equals()方法
- class B
- {
- public int hashCode()
- {
- return 1;
- }
- }
- //类C的hashCode()方法总是返回2,但没有重写其equals()方法
- class C
- {
- public int hashCode()
- {
- return 2;
- }
- public boolean equals(Object obj)
- {
- return true;
- }
- }
- public class TestHashSet
- {
- public static void main(String[] args)
- {
- HashSet<Object> books = new HashSet<Object>();
- //分别向books集合中添加2个A对象,2个B对象,2个C对象
- books.add(new A());
- books.add(new A());
- books.add(new B());
- books.add(new B());
- books.add(new C());
- books.add(new C());
- System.out.println(books);
- }
- }
class A { public boolean equals(Object obj) { return true; } } //类B的hashCode()方法总是返回1,但没有重写其equals()方法 class B { public int hashCode() { return 1; } } //类C的hashCode()方法总是返回2,但没有重写其equals()方法 class C { public int hashCode() { return 2; } public boolean equals(Object obj) { return true; } } public class TestHashSet { public static void main(String[] args) { HashSet<Object> books = new HashSet<Object>(); //分别向books集合中添加2个A对象,2个B对象,2个C对象 books.add(new A()); books.add(new A()); books.add(new B()); books.add(new B()); books.add(new C()); books.add(new C()); System.out.println(books); } }
[B@1, B@1 , C@2 , A@b5dac4 , A@9945ce]
程序运行结果:
说明:
(1)Object类提供的toString方法总是返回该对象实现类的类名+@+hashCode(16进制数)值,所以可以看到上面程序输出的结果。可以通过重写toString方法来输出自己希望的形式。
(2)即使2个A对象通过equals比较返回true,但HashSet依然把它们当成2个对象;即使2个B对象的hashCode()返回相同值,但HashSet依然把它们当成2个对象。即如果把一个对象放入HashSet中时,如果重写该对象equals()方法,也应该重写其hashCode()方法。其规则是:如果2个对象通过equals方法比较返回true时,这两个对象的hashCode也应该相同。
hash算法的功能:
它能保证通过一个对象快速查找到另一个对象。hash算法的价值在于速度,它可以保证查询得到快速执行。
当需要查询集合中某个元素时,hash算法可以直接根据该元素的值得到该元素保存位置,从而可以让程序快速找到该元素。
当从HashSet中访问元素时,HashSet先计算该元素的hashCode值(也就是调用该对象的hashCode())方法的返回值),然后直接到该hashCode对应的位置去取出该元素。
即也是快速的原因。HashSet中每个能存储元素的“曹位(slot)”通常称为“桶(bucket)”,如果多个元素的hashCode相同,但它们通过equals()方法比较返回false,就需要一个“桶”里放多个元素,从而导致性能下降。
继续深入研究HashSet:
当向HashSet中添加一个可变对象后,并且后面程序修改了该可变对象的属性,可能导致它与集合中其他元素相同,这就可能导致HashSet中包含两个相同的对象。
看下面程序:
- <SPAN>class R</SPAN>{
- int count;
- public R(int count)
- {
- this.count = count;
- }
- public String toString()
- {
- return "R(count属性:" + count + ")";
- }
- public boolean equals(Object obj)
- {
- if (obj instanceof R)
- {
- R r = (R)obj;
- if (r.count == this.count)
- {
- return true;
- }
- }
- return false;
- }
- public int hashCode()
- {
- return this.count;
- }
- }
- public class TestHashSet2
- {
- public static void main(String[] args)
- {
- HashSet<R> hs = new HashSet<R>();
- hs.add(new R(5));
- hs.add(new R(-3));
- hs.add(new R(9));
- hs.add(new R(-2));
- //打印TreeSet集合,集合元素是有序排列的
- System.out.println(hs);
- //取出第一个元素
- Iterator<R> it = hs.iterator();
- R first = (R)it.next(); //first指向集合的第一个元素
- //为第一个元素的count属性赋值
- first.count = -3; //first指向的元素值发生改变,地址并没有改变,大家可以试着用Java内存分配机制(栈和堆)思考下。
- //再次输出count将看到HashSet里的元素处于无序状态
- System.out.println(hs);
- hs.remove(new R(-3));
- System.out.println(hs);
- //输出false
- System.out.println("hs是否包含count为-3的R对象?" + hs.contains(new R(-3)));
- //输出false
- System.out.println("hs是否包含count为5的R对象?" + hs.contains(new R(5)));
- }
- }
class R{ int count; public R(int count) { this.count = count; } public String toString() { return "R(count属性:" + count + ")"; } public boolean equals(Object obj) { if (obj instanceof R) { R r = (R)obj; if (r.count == this.count) { return true; } } return false; } public int hashCode() { return this.count; } } public class TestHashSet2 { public static void main(String[] args) { HashSet<R> hs = new HashSet<R>(); hs.add(new R(5)); hs.add(new R(-3)); hs.add(new R(9)); hs.add(new R(-2)); //打印TreeSet集合,集合元素是有序排列的 System.out.println(hs); //取出第一个元素 Iterator<R> it = hs.iterator(); R first = (R)it.next(); //first指向集合的第一个元素 //为第一个元素的count属性赋值 first.count = -3; //first指向的元素值发生改变,地址并没有改变,大家可以试着用Java内存分配机制(栈和堆)思考下。 //再次输出count将看到HashSet里的元素处于无序状态 System.out.println(hs); hs.remove(new R(-3)); System.out.println(hs); //输出false System.out.println("hs是否包含count为-3的R对象?" + hs.contains(new R(-3))); //输出false System.out.println("hs是否包含count为5的R对象?" + hs.contains(new R(5))); } }
程序运行结果:
[R(count属性:5), R(count属性:9), R(count属性:-3), R(count属性:-2)]
[R(count属性:-3), R(count属性:9), R(count属性:-3), R(count属性:-2)]
[R(count属性:-3), R(count属性:9), R(count属性:-2)]
hs是否包含count为-3的R对象?false
hs是否包含count为5的R对象?false
说明:程序重写了R类的equals()和hashCode()方法,这两个方法都是根据R对象的count属性来判断。从运行结果可以看出,HashSet集合中有完全相同元素,这表明两个元素已经重复,但因为HashSet在添加它们时已经把它们添加到了不同地方,所以HashSet完全可以容纳两个相同元素。至于第一个count为-3的R对象,它保存在count为5的R对象对应的位置(地址)。当向HashSet中添加可变对象时,必须十分小心。如果修改HashSet集合中的对象,有可能导致该对象与集合中其他对象相等,从而导致HashSet无法准确访问该对象。
HashSet还有一个子类LinkedHashSet,LinkedHashSet集合也根据元素hashCode值来决定元素存储位置,但它同时使用链表维护元素的次序,即当遍历LinkedHashSet集合元素时,HashSet将会按元素的添加顺序来访问集合里的元素。
3、TreeSet类
TreeSet是SortedSet接口的唯一实现,TreeSet可以确保集合元素处于排序状态(元素是有序的)。
TreeSet提供的几个额外方法:
Comparator comparator(): 返回当前Set使用的Comparator,或者返回null,表示以自然方式排序。
Object first():返回集合中的第一个元素。
Object last():返回集合中的最后一个元素。
Objiect lower(Object e):返回集合中位于指定元素之前的元素(即小于指定元素的最大元素,参考元素可以不是TreeSet的元素)。
Object higher(Object e):返回集合中位于指定元素之后的元素(即大于指定元素的最小元素,参考元素可以不需要TreeSet的元素)。
SortedSet subSet(fromElement, toElement):返回此Set的子集,范围从fromElement(包含大于等于)到toElement(不包含小于)。
SortedSet headSet(toElement):返回此Set的子集,由小于toElement的元素组成。
SortedSet tailSet(fromElement):返回此Set的子集,由大于或等于fromElement的元素组成。
public class TestTreeSetCommon
- {
- public static void main(String[] args)
- {
- TreeSet<Integer> nums = new TreeSet<Integer>();
- //向TreeSet中添加四个Integer对象
- nums.add(5);
- nums.add(2);
- nums.add(10);
- nums.add(-9);
- //输出集合元素,看到集合元素已经处于排序状态
- System.out.println(nums);
- //输出集合里的第一个元素
- System.out.println(nums.first());
- //输出集合里的最后一个元素
- System.out.println(nums.last());
- //返回小于4的子集,不包含4
- System.out.println(nums.headSet(4));
- //返回大于5的子集,如果Set中包含5,子集中还包含5
- System.out.println(nums.tailSet(5));
- //返回大于等于-3,小于4的子集。
- System.out.println(nums.subSet(-3 , 4));
- }
- }
{ public static void main(String[] args) { TreeSet<Integer> nums = new TreeSet<Integer>(); //向TreeSet中添加四个Integer对象 nums.add(5); nums.add(2); nums.add(10); nums.add(-9); //输出集合元素,看到集合元素已经处于排序状态 System.out.println(nums); //输出集合里的第一个元素 System.out.println(nums.first()); //输出集合里的最后一个元素 System.out.println(nums.last()); //返回小于4的子集,不包含4 System.out.println(nums.headSet(4)); //返回大于5的子集,如果Set中包含5,子集中还包含5 System.out.println(nums.tailSet(5)); //返回大于等于-3,小于4的子集。 System.out.println(nums.subSet(-3 , 4)); } }
程序运行结果:[-9, 2, 5, 10]
-9
10
[-9, 2]
[5, 10]
[2]说明:由运行结果可以看出,TreeSet并不是根据元素的插入顺序进行排序,而是根据元素实际值来进行排序。TreeSet采用红黑树的数据结构对元素进行排序,具体排序内容会在后续文章中说明。