我们知道Set集合有“自动去重”的特性,如果我们在其中存放的不是String、Integer之类的基本数据类型,而是自定义的类,那么Set集合凭什么来判断“重复”?我们来看一下SetDupDemo.java的代码。
1 //省略import集合包的代码
2 //请注意实现了Comparable接口
3 class Student implements Comparable{
4 private int id;
5 public Student(int id){ this.id = id; }
6 public int getId()
7 {return id;}
8 //判断是否相等
9 public boolean equals(Student stu)
10 {
11 if( stu.getId() == this.id )
12 { return true; }
13 else { return false; }
14 }
15 //通过重写compareTo方法,判断是否能加入Set里
16 public int compareTo(Object obj) {
17 // 判断是否是学生类型
18 if (obj instanceof Student) {
19 Student s = (Student) obj;
20 // 如果是学生类型,如果学号相等,则不加入Set
21 if (s.getId() == this.getId()) {
22 return 0;
23 } else {
24 return s.getId()>this.getId()?1:-1;
25 }
26 // 不是学生类型对象的话就不要加入它
27 } else { return 0; }
28 }
29 }
从第3到29行,我们定义了一个Student类,为了把它放入Set,我们需要实现Comparable接口,并重写其中的compareTo方法。
从第9到14行,我们重写了用于判断两个Student对象是否相等的equals方法,如果不写,将用Object的方法(这个方法是通过判断两个对象的地址是否一致来判断两个对象是否相等)。
TreeSet对象不会根据equals方法判断是否重复,也就是说,即使我们注释掉了这个方法,不会影响到运行结果,但在自定义类里,重写equals方法是个很好的习惯。
在第16行到28行的compareTo方法里,我们将根据返回int类型的值,执行对应的动作。
如果返回0,则表示该对象已经存在于Set里了,这个对象无法再次加入。
如果返回1或-1,则表示Set里还没有和它相同的对象,可以加入。具体的1和-1的差别将在后继讲述“Collections排序”时详细分析。
30 public class SetDupDemo {
31 public static void main(String[] args) {
32 Set intSet = new HashSet();
33 intSet.add(1);
34 intSet.add(1);
35 System.out.println(intSet.size()); //输出结果是1
36 Student s1 = new Student(1);
37 Student s2 = new Student(1);
38 Set<Student> stuSet = new TreeSet<Student>();
39 stuSet.add(s1);
40 stuSet.add(s2);
41 System.out.println(stuSet.size()); //输出结果是1
42 }
43 }
在main函数的第32行里,我们定义了一个HashSet对象,当我们在第33和34行放入两个相等的数值进去时,由于Set对象不允许重复值插入,所以其实只放入了一个,这点可以从第35行打印结果里得到验证。
在第38行,我们通过泛型的方式定义了一个只能容纳Student类的TreeSet对象,并在第39和40行放入了两个id都是1的Student对象。
在放入s2时,需要判断在stuSet里是否已经存在相同的对象,具体做法是:与已经存在的对象(也就是s1)逐一通过compareTo方法比较,这里当调用s1.compareTo(s1)时,发现两者id一致,所以返回是0,说明s2等于s1,所以不会放入到stuSet里。这点可以通过41行的输出结果得到验证。
我见过一些初级程序员在用TreeSet存储自定义类时,没有重写compareTo方法(可能他们并不知道还有这么回事),而且他们会根据两个学生id都是1这个情况,想当然地认为它们相等,最后当TreeSet并没有按预期想象那样去掉重复的Student时,他们就百思不得其解了。确实,这里很容易出错,再次强调,我们是用重写compareTo的方式来判断对象是否可以加入TreeSet。
请再次注意,我们在上文里仅仅讲到了TreeSet判断自定义类是否重复的方式,如果大家在38行里把stuSet对象定义成HashSet,第41行的输出结果是2。
- Set<Student> stuSet = new TreeSet<Student>();
也就是说,对于HashSet,我们不仅靠CompareTo方法,我们更得靠equals和hashCode方法。
关于集合类的面试文章汇总:
Java集合方面的面试题:对比ArrayList和Vector对象,分析Vector为什么不常用
Java集合方面的面试题:ArrayList和LinkedList有什么差别?分别适用于哪些场景?
Java集合方面的面试题:TreeSet、HashSet和LinkedHashSet的各自特点
这是我的公众号,其中包含了大量面试文章,同时我自己出了多本Python和Java方面的书籍,会定期在公众号里发书的电子版。请大家关注下我的公众号,谢谢了。