hashCode是jdk根据对象的地址或者字符串或者数字算出来的int类型的数值 详细了解请 参考 public inthashCode()返回该对象的哈希码值。支持此方法是为了提高哈希表(例如 java.util.Hashtable 提供的哈希表)的性能。
在java集合中的collection中分为Set和List两个接口,分别有实现该接口的类,其中Set接口常用实现的两个类是HashSet和TreeSet类,而Set集合与List集合的不同之处是Set集合中的元素无序且不能重复,判断对象是否重复常用的是Objiect类中的equals()方法来进行比较
public boolean equals(Object obj){
return (this==obj);
}
可以看出是对两个对象的地址值进行比较(即比较引用是否相同)
Java中对equals()有这几点要求:
(1)对称性:如果x.equals(y)返回的是”true”,那么y.equals(x)也应该返回”true”。
(2)反射性:x.equals(x)必须返回”true”。
(3)类推性:如果x.equals(y)返回”true”。而且y.equals(z)返回的是”true”,那么z.equals(x)也应该返回”true”。
(4)一致性:如果x.equals(y)返回”true”,只要x和y内容不变,不管x.equals(y)重复多少次都返回”true”。
(5)任何情况下x.equals(null)返回”false”;x.equals(与x不同类型的对象)返回”false”。
那么hashCode在此扮演一个怎样的角色呢?
通常在查找一个集合是否包含某个对象时,就依次取出集合中每个元素与要查找的元素进行比较,如果某个元素与要查找的对象斤进行equals方法比较后相等,则停止查找,但如果集合中元素过多,用这种方法查找极不方便,而hashCode方法将集合分为若干个存储区域,每个对象对应一个哈希码,将哈希码分组,每组对应一个对象的哈希码就可以确定应该存储在哪个区域。因此当集合要添加一个新的元素时,先调用hashCode方法确定该元素的位置,如果此位置没有元素,直接存储在此位置,如果有元素就调用equals方法来与该元素进行比较,相同的话就不用存储了,不同的话就散列在其他位置 ,可见用hashCode方法可以大大提高查找效率。
如果想要覆盖hashCode()方法,比如在String、Integer、Double等这些封装类中都是重写了hashCode()方法的,下面是一个String类中定义的hashCode()方法
public int hashCode(){
int h=hash;
if(h==0){
int off=offset;
char val[]=value;
int len=count;
for(int i=0;i<len;i++){
h=31*h+val[off++];
}
hash=h;
}
return h;
}
在String的API中写到
s[0]*31^(n-1)+s[1]*31^(n-2)+...+s[n-1]
这里s[i]是字符串的第i个字符,n是字符串的长度,^表示求幂。(空字符串的哈希码为0。)
下面了解hashCode()和equals()在hashset、hashmap和hashtable中的使用
(1)前面说过HashSet是实现Set接口的类,其在判断元素是否重复依据如下:
首先判断两个对象的hashCode是否相等,如果相等则判断其两个对象的equals运算是否相等,相等则认为两对象相等,不相等则对象不等。
由此说明当两对象hashcode相等时,equals()有可能不等,比如下面代码:
public static void main(String[] args){
String s1=new String("zhangsan");
String s2=new String("zhangsan");
System out printIn(s1==s2);//4
System out printIn(s1.equals(s2));//5
System out printIn(s1.hashCode());//6
System out printIn(s2.hashCode());//7
Set hashset=new Hashset();
hashset.add(s1);
hashset.add(s2);
System out printIn(hashset.size());//11
}
说明:第4行代码返回false,因为比较两个对象的引用,因为new了两次,所以不相等;第5行代码返回true,因为s1与s2中内容相同;第6、7行代码的s1.hashCode()等于s2.hashCode();第11行返回1,因为HashSet集合中添加的s1和s2的哈希码相等且equals()方法相等则为相同对象,只存储一次。
小结;
(1)equals()相等的两个对象,hashcode()一定相等,但equals()不相等的两个对象,hashcode()有可能相等;反过来hashcode()不相等,equals()一定不等,hashcode()相等,equals()不一定相等。换句话说就是比较两个对象是否相同,先判断其hashcode(),再判断equals(),二者都相等则对象相等,只要有一次不相等,则对象不相等。
(2)hashCode()方法会算出一个哈希码值返回,然后HashSet会用哈希码值去和数组长度取模,对象的模值(这个模值就是对象要存放在数组中的位置,和数组的下标相同)相同时才会判断数组中的元素和要插入的对象是否相等,如果不等会再找位置添加进去,相等则不允许添加。