JAVA HashSet的内容的唯一性

 

1. 通过具体的例子来说明:

public class HashSetDemo {
	public static void main(String[] args) {
		// 创建集合对象
		HashSet<String> hs = new HashSet<String>();

		// 创建并添加元素
		hs.add("hello");
		hs.add("world");
		hs.add("java");
		hs.add("world");

		// 遍历集合
		for (String s : hs) {
			System.out.println(s);
		}
	}
}

2. 查看HashSet的add源代码

public class HashSet<E>
    extends AbstractSet<E>
    implements Set<E>, Cloneable, java.io.Serializable
{
    static final long serialVersionUID = -5024744406713321676L;

    private transient HashMap<E,Object> map;

    // Dummy value to associate with an Object in the backing Map
    private static final Object PRESENT = new Object();
    ......

    public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }

    ......
}

从源代码可以看出,HashSet集合的底层实现是HashMap.图中的泛型E,就是我们要增加的元素的类型。接着我们查看HashMap的put方法的实现

public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable {

    ......
	public V put(K key, V value) { //key=e=hello,world
	
		//看哈希表是否为空,如果空,就开辟空间
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
        
        //判断对象是否为null
        if (key == null)
            return putForNullKey(value);
        
        int hash = hash(key); //和对象的hashCode()方法相关
        
        //在哈希表中查找hash值
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        	//这次的e其实是第一次的world
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
                //走这里其实是没有添加元素
            }
        }

        modCount++;
        addEntry(hash, key, value, i); //把元素添加
        return null;
    }
    
    transient int hashSeed = 0;
    
    final int hash(Object k) { //k=key=e=hello,
        int h = hashSeed;
        if (0 != h && k instanceof String) {
            return sun.misc.Hashing.stringHash32((String) k);
        }

        h ^= k.hashCode(); //这里调用的是对象的hashCode()方法

        // This function ensures that hashCodes that differ only by
        // constant multiples at each bit position have a bounded
        // number of collisions (approximately 8 at default load factor).
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

    ......


}

3. 源码总结

 /* 通过查看add方法的源码,我们知道这个方法底层依赖 两个方法:hashCode()和equals()。
 * 步骤:
 *         首先比较哈希值
 *         如果相同,继续走,比较地址值或者走equals()
 *         如果不同,就直接添加到集合中    
 * 按照方法的步骤来说:    
 *         先看hashCode()值是否相同
 *             相同:继续走equals()方法
 *                 返回true:    说明元素重复,就不添加
 *                 返回false:说明元素不重复,就添加到集合
 *             不同:就直接把元素添加到集合
 * 如果类没有重写这两个方法,默认使用的Object()。一般来说不相同。
 * 而String类重写了hashCode()和equals()方法,所以,它就可以把内容相同的字符串去掉。只留下一个。
 */

4. 自定义对象的唯一性实现

首先自定义对象Student.java

public class Student {
	private String name;
	private int age;

	public Student() {
		super();
	}

	public Student(String name, int age) {
		super();
		this.name = name;
		this.age = age;
	}

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}

	public int getAge() {
		return age;
	}

	public void setAge(int age) {
		this.age = age;
	}

	 @Override
	 public String toString() {
	     return "Student [name=" + name + ", age=" + age + "]";
	 }

}

接着定义HashSet并且添加Student对象

import java.util.HashSet;

/*
 * 需求:存储自定义对象,并保证元素的唯一性
 * 要求:如果两个对象的成员变量值都相同,则为同一个元素。
 * 
 */
public class HashSetDemo2 {
	public static void main(String[] args) {
		// 创建集合对象
		HashSet<Student> hs = new HashSet<Student>();

		// 创建学生对象
		Student s1 = new Student("林青霞", 27);
		Student s2 = new Student("柳岩", 22);
		Student s3 = new Student("王祖贤", 30);
		Student s4 = new Student("林青霞", 27);
		Student s5 = new Student("林青霞", 20);
		Student s6 = new Student("范冰冰", 22);

		// 添加元素
		hs.add(s1);
		hs.add(s2);
		hs.add(s3);
		hs.add(s4);
		hs.add(s5);
		hs.add(s6);

		// 遍历集合
		for (Student s : hs) {
			System.out.println(s.getName() + "---" + s.getAge());
		}
	}
}

运行结果:

从上面的的运行结果可以知道,目前是不符合我的要求的。

因为我们知道HashSet底层依赖的是hashCode()和equals()方法。而这两个方法我们在学生类中没有重写,所以,默认使用的是Object类。这个时候,他们的哈希值是不会一样的,根本就不会继续判断,执行了添加操作。

所以对于自定义对象,为了保证唯一性,自定义对象添加到HashSet的需要重写hashCode()和equals()方法,修改自定义对象Student如下:

public class Student {
	private String name;
	private int age;

	public Student() {
		super();
	}

	public Student(String name, int age) {
		super();
		this.name = name;
		this.age = age;
	}

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}

	public int getAge() {
		return age;
	}

	public void setAge(int age) {
		this.age = age;
	}


	 @Override
	 public int hashCode() {
	 // return 0;
	 // 因为成员变量值影响了哈希值,所以我们把成员变量值相加即可
	 // return this.name.hashCode() + this.age;
	 // 看下面
	 // s1:name.hashCode()=40,age=30
	 // s2:name.hashCode()=20,age=50
	 // 尽可能的区分,我们可以把它们乘以一些整数
	     return this.name.hashCode() + this.age * 15;
	 }
	
	 @Override
	 public boolean equals(Object obj) {
    	 // System.out.println(this + "---" + obj);
    	 if (this == obj) {
    	 return true;
	     }
	
    	 if (!(obj instanceof Student)) {
	     return false;
	     }
	
	     Student s = (Student) obj;
	     return this.name.equals(s.name) && this.age == s.age;
	 }
	
	 @Override
	 public String toString() {
		 return "Student [name=" + name + ", age=" + age + "]";
	 }

}

Hash值主要是被成员变量所影响,所以我们在重写hashCode()方法时,把成员变量相加即可,当然hash值一样并不能代表Student对象就是一样的,如代码中所示的那样,所以我们为了保证hashCode()的值尽量的不一样,我们随便的给age乘以一个数字,这样就会使得相加的结果尽可能的不一样,从而实现hashCode()不一致。

当然通过IDE(Eclipse或者Android Studio)工具生成的hashCode()和equals()方法,跟我们自己重写的思路是一致的,但是他们实现起来更健全或者说更方便,所以当我们使用自定义的引用类型,最终我们使用IDE工具生成的方式重写hashCode()和equals()方法。代码如下:

package com.wdy.hashset_01;

/**
 * @author Administrator
 * 
 */
public class Student {
	private String name;
	private int age;

	public Student() {
		super();
	}

	public Student(String name, int age) {
		super();
		this.name = name;
		this.age = age;
	}

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}

	public int getAge() {
		return age;
	}

	public void setAge(int age) {
		this.age = age;
	}

	@Override
	public int hashCode() {
		final int prime = 31;
		int result = 1;
		result = prime * result + age;
		result = prime * result + ((name == null) ? 0 : name.hashCode());
		return result;
	}

	@Override
	public boolean equals(Object obj) {
		if (this == obj)
			return true;
		if (obj == null)
			return false;
		if (getClass() != obj.getClass())
			return false;
		Student other = (Student) obj;
		if (age != other.age)
			return false;
		if (name == null) {
			if (other.name != null)
				return false;
		} else if (!name.equals(other.name))
			return false;
		return true;
	}

//	 @Override
//	 public int hashCode() {
//	 // return 0;
//	 // 因为成员变量值影响了哈希值,所以我们把成员变量值相加即可
//	 // return this.name.hashCode() + this.age;
//	 // 看下面
//	 // s1:name.hashCode()=40,age=30
//	 // s2:name.hashCode()=20,age=50
//	 // 尽可能的区分,我们可以把它们乘以一些整数
//	 return this.name.hashCode() + this.age * 15;
//	 }
//	
//	 @Override
//	 public boolean equals(Object obj) {
//	 // System.out.println(this + "---" + obj);
//	 if (this == obj) {
//	 return true;
//	 }
//	
//	 if (!(obj instanceof Student)) {
//	 return false;
//	 }
//	
//	 Student s = (Student) obj;
//	 return this.name.equals(s.name) && this.age == s.age;
//	 }
//	
//	 @Override
//	 public String toString() {
//		 return "Student [name=" + name + ", age=" + age + "]";
//	 }

}

执行效果:

5. 自定义对象HashSet的图解

此图解是基于我们自己重写hashCode()和equals()方法。在HashCode()中直接返回0的情况下进行的图解

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值