总的来说,Java中的集合(collection)有两类:List和Set。
List:元素有序,可按索引操作,可以重复
Set:元素无序,不可以重复
那么Java中如何判断两个元素是否是重复的呢?
可以使用equals方法来进行判断,但是java使用的不是这种方式,原因是存在弊端,
当集合中元素很多时,后面添加进来的元素就得多次调用equals方法进行比较,如添加第1001个
元素时就得执行1000次equals方法来判断是否重复,这样效率是很低的,
于是Java采用了哈希表的原理,哈希是一个人名,因为哈希算法是他提
出的,哈希算法也成为散列算法,Object类中的hasCode方法默认返回的是根据该对象存储在堆内
的物理地址值转换生成的一个整数,因为地址不可能重复,所以默认生成的哈希值已经具有唯一性,
这样一来当集合中要添加新的元素时,先调用各元素的
hasCode方法,就能直接定位到他应该放置的物理位置上,如果刚好这个
位置上没有元素,他就可以直接存储在这个位置,不用再进行任何一次的
equals比较,如果这个位置上已经有元素存在,就调用她的equals方法与
新元素进行比较,相同的话就说明重复就不存储,不同的话就散列其他的
地址,这样一类实际调用equals方法的次数就会大大降低,几乎只需一两
次即可。
一般类如果重写了hsahCode()方法,就改变了生成对象哈希值的方式,如Integer类重写了hashCode()方法,
返回的哈希值为数字本身,如Integer i = new Integer(2);那么对象i的哈希值就为2。
问题1:为什么有必要重写hashCode()方法:
通过上面我们知道,Object类中的hashCode()方法默认返回的该对象在堆内地址转换而成的整数,
因为地址不可能重复,所以每个对象都有自己不同的哈希值,所以即便是相等的对象,因为内存
的不同也会产生不同的哈希值,这就违反了hashCode方法的常规协定。
常规协定指的是:相等对象必须具有相等的哈希码。所以java要求尽量要重写hashCode()方法
来维护此协定,但不是硬性的要求,也就是说可以只重写equals而不重写hashCode。
(非硬性规定)
一般建议当equals返回false时,对应的哈希值也要不相等,因为当哈希值相同时,会接着判断equals,
此时如果equals不相同,视为不同的元素, 这时就相当于同一个位置存储了两个不同的值,
本来位置不同就代表不同,现在位置不同还要再使用其他算法再判断是否相同,这样做就降低了效率。
hascode和equals的关系:
1.如果两个对象相等,那么他们的hascode值一定相等。
2.如果两个对象的hascode值相同,,他们不一定相等。
3.hascode不等,那么equals一定不等
4.hascode相等,equals不一定相等。
----------------------------------------------------------------------------------
Java集合中实际判断两个对象是否相等的规则是:
1)判断两个对象的hascode是否相等,
如果不相等,认为两个对象也不相等,完毕!
如果相等,执行第2步
2)判断两个对象的equals是否相等
如果不相等,认为两个对象也不相等,完毕!
如果相等,认为两个对象相等,完毕!