很多时候,我们会使用java的hashCode在一定范围内区别对象。但是我们对java的hashCode生成规则了解多少?翻看JDK源码就可以看到我们常用的数据结构,如HashMap,ArrayList,String,Integer等类型HashCode的实现方式。
Java中的所有类的基类Object类中定义并实现了方法hashCode(),在Object类中该方法被定义成为native方法,由虚拟机的实现部分提供实现(并且注释中提到在TM版JAVA编程语言是不需要实现的),该方法返回当前对象内存地址的整数值。当我们在定义一个类型的时候,没有重载hashCode方法的情况下,我们自定类对象的hashCode方法返回的都是当前对象的内存地址。这在一些序列化和反序列化处理之后,对象的hashcode就可能不相等了,Object类实现的HashCode算法与具体的运行时环境相关,很多时候我们希望跟数据本身相关性高一点。
Object类提供了默认的hashCode计算方式,在JDK提供的基础集合类中分别对hashCode方法进行了重载。以下分别说明一下各个基础类的hashCode的实现
1、String,对应String而言在没有重写hashCode方法的情况,一个确定的String,比如"Hello World"在不同的时候,在不同的机器上计算出来的值是不相同的。但是String重写了hashCode方法,能够保证,其hashcode值只跟所包含的字符以及字符的顺序有关系,跟计算的时间和机器本身无关,一下是String hashCode方法的实现:
public int hashCode() {
int h = hash;
if (h == 0) {
int off = offset;
char val[] = value;
int len = count;
for (int i = 0; i < len; i++) {
h = 31*h + val[off++];
}
hash = h;
}
return h;
}
从代码中可以看到,String的hashCode计算公式为:s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1](s是该String的字符数组)。计算中使用的周期是31,显然这个周期远小于字符集合的大小,所以该hashCode没法保证所有的String对象的hashCode不冲突。
2 Integer 的hashCode不需要计算,就是它本本身,代码如下:
public int hashCode() {
return value;
}
3 ArrayList ArrayList的并没有自己实现hasnCode方法,而是沿用了其父类AbstractCollection实现的方法,代码如下:
public int hashCode() {
int hashCode = 1;
Iterator<E> i = iterator();
while (i.hasNext()) {
E obj = i.next();
hashCode = 31*hashCode + (obj==null ? 0 : obj.hashCode());
}
return hashCode;
}
可以看到,代码与String的hashCode计算方式很类似。
4、HashMap 中也没有直接实现hashCode方法,也是沿用的其父类实现的方法,代码如下
public int hashCode() {
int h = 0;
Iterator<Entry<K,V>> i = entrySet().iterator();
while (i.hasNext())
h += i.next().hashCode();
return h;
}
可以看出HashMap的hashCode值是由其包含的所有Entry对象的hashCode累加得到的,再来看看其Entry的hashCode值又是如何得来的,代码如下
public final int hashCode() {
return (key==null ? 0 : key.hashCode()) ^
(value==null ? 0 : value.hashCode());
}
可以看到HashMap的Entry的hashCode值是有key的hash值与value的乘方计算得来了(有效降低冲突率)