问题
HashSet一般会根据对象的equals()方法和hashCode()方法比较两个对象是否相等,而对于普通的数组例如,int[]、char[]、char[][]这些,只会根据他们的引用比较(类似C++中的指针)。这就会导致,即使我们常见了两个内容相同的字符数组,HashSet也认为它们是不一样的:
import java.util.HashSet;
import java.util.Scanner;
public class Main {
public static void main(String[] args) {
HashSet<char[]> set = new HashSet<>();
char[] s1={'a','b','c','d','e','f','g','h'};
char[] s2={'a','b','c','d','e','f','g','h'};
set.add(s1);
set.add(s2);
System.out.println("虽然s1和s2内容相同,但是set中把两个都存了:"+set.size());
}
}
运行结果
虽然s1和s2内容相同,但是set中把两个都存了:2
这就非常的头疼:
解决方法
根据开头的提示,我们可以把char[]封装成一个类,然后重写equals()方法和hashCode()方法。
import java.util.Arrays;
import java.util.HashSet;
import java.util.Scanner;
public class Main {
public static void main(String[] args) {
HashSet<Char> set = new HashSet<>();
char[] s1 = {'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'};
char[] s2 = {'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'};
Char c1 = new Char(s1);
Char c2 = new Char(s2);
set.add(c1);
set.add(c2);
System.out.println("这时候两个数组被认为是相同的:" + set.size());
}
static class Char {
char[] s;
public Char(char[] s) {
//深拷贝,传入的参数修改,不会影响Char类中的字符数组s
this.s = Arrays.copyOf(s, s.length);
}
@Override
public boolean equals(Object obj) {
//同一个对象
if (obj == this) return true;
//不是同一个类
if (!(obj instanceof Char)) return false;
Char c = (Char) obj;
//equals比较一维数组的内容
return Arrays.equals(s, c.s);
}
@Override
public int hashCode() {
return Arrays.hashCode(s);
}
}
}
注意:
- 再传递数组的时候,最好不要直接赋值,因为参数传递的是一个引用,如果更改参数值会影响到创建的对象中的值。
- 这个方法,二维、三维、四维………都适用,只需要把Arrays.equals()方法换成deepEquals() 方法即可。
总结
如果需要比较任何不能直接使用 equals()
和 hashCode()
方法来比较内容的类,或者基本数据类型创建的数组,我们可以重写对应的标红的两个方法(基本数据类型需要包装成一个自定义类)即可。
额外补充:
Arrays.equals方法会根据数组元素进行比较两个数组是否相等。那么我们只用重写equals方法就可以啦。为什么还要重写hashCode()方法?
这样做其实是为了让两个元素相同的数组“看起来是一致的,没有本质区别”。
如果我们要把这两个数组放到HashTable中,不重写hashCode方法,那么在HashTable中不会认为两个相同元素的数组是一致的。因为HashTable是通过元素的hash值,去把元素分散到HashTable中的。
什么,你问什么是哈希桌子?想要深入了解哈希桌子的请进入传送门:什么是哈希表?