于是,Java采用了哈希表的原理。哈希(Hash)实际上是个人名,由于他提出一哈希算法的概念,所以就以他的名字命名了。哈希算法也称为散列算法,是一种数据算法并非java所独有,是将数据依特定算法直接指定到一个地址上。。在java中由于hashCode方法定义在Object类中,因此每个对象都有一个默认的散列码。可以这样理解,hashCode方法实际上返回的就是对象存储的物理地址(实际可能并不是)。这样一来,当集合要添加新的元素时,先调用这个元素的hashCode方法,就一下子能定位到它应该放置的物理位置上。如果这个位置上没有元素,它就可以直接存储在这个位置上,不用再进行任何比较了;如果这个位置上已经有元素了,就调用它的equals方法与新元素进行比较,相同的话就不存了。可是如果不相同就存在一个冲突解决的问题,还要通过冲突解决算法散列其它的地址。这样一来实际调用equals方法的次数就大大降低了,几乎只需要一两次。
在java中对equals方法和hashCode方法有以下规定:
1.如果重新定义了equals方法,就必须重新定义hashCode方法,以便可以将对象插入到散列表中。
2.equals方法与hashCode方法的定义必须一致:如果x.equals(y)返回true,那么x.hashCode()就必须与y.hashCode()具有相同的值。即两个相等的对象要求返回相等的散列码。那么如果我们定义了一个员工类,并重新定义equals方法比较两个员工对象的ID相等即返回true,那么hashCode方法就需要散列ID属性,而不是姓名、住址等属性。
3.如果两个对象x、y的hashCode相同,它们并不一定相同,即x.equals(y)不一定返回true。当两个hashCode相同的对象加入到集合类中,按照上文的处理方法进行处理。
简单的说就是:如果两个对象相同,那么它们的hashCode值一定要相同;如果两个对象的hashCode相同,它们并不一定相同。这里说的对象相同指的是用eqauls方法比较。