java的Set集合:HashSet集合

Set最大的特性就是不允许在其中存放的元素是重复的。
根据这个特点,我们就可以使用Set 这个接口来实现前面提到的关于商品种类的存储需求。Set 可以被用来过滤在其他集合中存放的元素,从而得到一个没有包含重复元素的集合。

1.HashSet类

在set类型的集合中,如何判断元素是否重复呢,这就需要使用Object.equals方法,但如果元素很多了,添加一个新元素时,比较的次数 就很多,例如已经有100个元素了,添加第101个元素时,就要和前面的元素比较100次,效率很低。

hasCode实际上是返回的对象存储的物理地址
HashSet类按照哈希算法来存取对象,当向集合中加入一个新对象时,会调用对象的HashCode()方法得到对象的哈希码,然后根据这个码计算出对象在集合中存储的位置。
不能保证元素在集合中的排列顺序,可能与添加顺序不同或发生变化。

HashSet判断两个元素相等的标准时:HashSet在存储元素的时候,是先查看两个对象的哈希值是否一样的,如果哈希值是一样,再调用元素对象的equals方法,查看两个对象的内容是否一样。

如果没有重写hashCode()方法:

import java.util.HashSet;
//重写对象的equal()方法与hashCode()方法
class R{
    int count;

    public R(int count){
        this.count = count;
    }

    public String toString(){
        return "R[count:" + count +"]";
    }
}

public class HashSetTree {

    public static void main(String[] args) {
        HashSet<R> hs = new HashSet<R>();
        hs.add(new R(5));
        hs.add(new R(10));
        hs.add(new R(20));
        hs.add(new R(20));
        System.out.println(hs);

        java.util.Iterator<R> it = hs.iterator();
        R first = it.next();
        first.count = 5;
        System.out.println(hs);

        hs.remove(new R(5));
        System.out.println(hs);

        hs.remove(new R(5));
        System.out.println(hs);

        hs.remove(new R(20));
        System.out.println(hs);

    }
}

所有事物输出结果都是:[R[count:5], R[count:20], R[count:20], R[count:10]],这是因为每次新new一个对象,它产生的哈希码都是不同的,所以会添加重复的元素。

建议:自定义对象,一定要重写hashCode和equals两个方法
如果不重写,则默认的本地方法hashCode【OS来产生】会产生值都不一样的hashCode,即使内容重复的元素也会被添加到HashSet中,无法保证元素的唯一性。

重写hashCode和equals的时候,常犯的错误:
[1]. 子类重写hashCode的时候,将方法名写错,写成hasCode
[2]. 子类重写equals的时候,将参数传错,本来应该是public boolean equals(Object obj){}却写成了public boolean equals(自定义类型自定义类型引用)。这样集合框架的底层不会调用这个重载的方法。
[3].为了保证HashSet能正常工作,要求当两个对象用equals比较相等时,hashCode也要相等,否则就会有可能加入两个相同的项。如果equals比较相等,但hashCode不相等,hashSet会把这两个对象存在不同的位置,可以添加成功,但与set集合的规则相冲。如果equals比较不相等,但hashCode相等,则HashSet试图把他们存在一个位置,会用链式结构来存储,导致性能下降。

代码


package com.cn;

import java.util.HashSet;
//重写对象的equal()方法与hashCode()方法
class R{
    int count;

    public R(int count){
        this.count = count;
    }

    public String toString(){
        return "R[count:" + count +"]";
    }

    public boolean equals(Object obj){
        if(this == obj){
            return true;
        }
        if(obj == null){
            return false;
        }
        if(obj.getClass() == this.getClass()){
            R r = (R)obj;
            return this.count == r.count;
        }
        return false;
    }

    public int hashCode(){
        return this.count;
    }
}

public class HashSetTree {

    public static void main(String[] args) {
        HashSet<R> hs = new HashSet<R>();
        hs.add(new R(5));
        hs.add(new R(10));
        hs.add(new R(20));
        hs.add(new R(20));
        System.out.println(hs);//输出结果:[R[count:20], R[count:5], R[count:10]]

        java.util.Iterator<R> it = hs.iterator();
        R first = it.next();
        first.count = 5;
        System.out.println(hs);//输出结果:[R[count:5], R[count:5], R[count:10]]

        hs.remove(new R(5));
        System.out.println(hs);//输出结果:[R[count:5], R[count:10]]

        hs.remove(new R(5));
        System.out.println(hs);//输出结果:[R[count:5], R[count:10]]

        hs.remove(new R(20));
        System.out.println(hs);//输出结果:[R[count:5], R[count:10]]

    }
}

从上面的程序可以看出,如果改变了Set集合中的某个元素,但是存储这个元素的hashCode值不会改变,元素改变之后,HashSet依然可以正常输出,但是排序混乱,如果试图删除该元素时,也会导致他无法删除,因为该元素所处位置的元素值与哈希码是不对应的。

总结:把对象添加到HashSet中之后,尽量不要修改集合元素中参与计算hashCode()与equals()的属性,否则将导致HashSet无法正确操作这些元素。

  • LinkedHashSet类

按照元素集合里的添加顺序来访问集合中的元素。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值