java hashset算法_java 中的集合(九) HashSet源码分析

HashSet实现了Set接口,由哈希表(实际上是一个HashMap实例,HashMap参考:

链接)支持。它不保证set的迭代顺序,特别是它不保证该顺序恒久不变,但可保证包含的元素不会重复。HashSet允许使用null元素(很显然,HashMap也允许使用空值key)。

package java.util;

public class HashSet

extends AbstractSet

implements Set, Cloneable, java.io.Serializable

{

static final long serialVersionUID = -5024744406713321676L;

// HashSet是通过map(HashMap对象)保存内容的

private transient HashMap map;

// 定义一个虚拟的Object PRESENT作为向map中插入的value

// 因为HashSet中只需要用到key,而HashMap是key-value键值对;

// 所以,向map中添加键值对时,键值对的值固定是PRESENT

private static final Object PRESENT = new Object();

// 默认构造函数 底层创建一个HashMap

public HashSet() {

// 调用HashMap的默认构造函数,创建map

map = new HashMap();

}

// 带集合的构造函数

public HashSet(Collection extends E> c) {

// 创建map。

// 为什么要调用Math.max((int) (c.size()/.75f) + 1, 16),从 (c.size()/.75f) + 1 和 16 中选择一个比较大的数呢?

// 首先,说明(c.size()/.75f) + 1

// 因为从HashMap的效率(时间成本和空间成本)考虑,HashMap的加载因子是0.75。

// 当HashMap的“阈值”(阈值=HashMap总的大小*加载因子) < “HashMap实际大小”时,需要扩容

// 接下来,说明为什么是 16 。

// HashMap的总的大小,必须是2的指数倍。若创建HashMap时,指定的大小不是2的指数倍;

// HashMap的构造函数中也会重新计算,找出比“指定大小”大的最小的2的指数倍的数。

// 所以,这里指定为16是从性能考虑。避免重复计算。(注:HashMap默认初始大小也是16)

map = new HashMap(Math.max((int) (c.size()/.75f) + 1, 16));

// 将集合(c)中的全部元素添加到HashSet中

addAll(c);

}

// 指定HashSet初始容量和加载因子的构造函数

public HashSet(int initialCapacity, float loadFactor) {

map = new HashMap(initialCapacity, loadFactor);

}

// 指定HashSet初始容量的构造函数

public HashSet(int initialCapacity) {

map = new HashMap(initialCapacity);

}

HashSet(int initialCapacity, float loadFactor, boolean dummy) {

map = new LinkedHashMap(initialCapacity, loadFactor);

}

// 返回HashSet的迭代器

public Iterator iterator() {

// 实际上返回的是HashMap的“key集合的迭代器”

return map.keySet().iterator();

}

//调用HashMap的size()方法返回Entry的数量,得到该Set里元素的个数

public int size() {

return map.size();

}

//调用HashMap的isEmpty()来判断HaspSet是否为空

//HashMap为null。对应的HashSet也为空

public boolean isEmpty() {

return map.isEmpty();

}

//调用HashMap的containsKey判断是否包含指定的key

//HashSet的所有元素就是通过HashMap的key来保存的

public boolean contains(Object o) {

return map.containsKey(o);

}

// 将元素(e)添加到HashSet中,也就是将元素作为Key放入HashMap中

public boolean add(E e) {

return map.put(e, PRESENT)==null;

}

// 删除HashSet中的元素(o),其实是在HashMap中删除了以o为key的Entry

public boolean remove(Object o) {

return map.remove(o)==PRESENT;

}

//清空HashMap的clear方法清空所有Entry

public void clear() {

map.clear();

}

// 克隆一个HashSet,并返回Object对象

public Object clone() {

try {

HashSet newSet = (HashSet) super.clone();

newSet.map = (HashMap) map.clone();

return newSet;

} catch (CloneNotSupportedException e) {

throw new InternalError();

}

}

// java.io.Serializable的写入函数

// 将HashSet的“总的容量,加载因子,实际容量,所有的元素”都写入到输出流中

private void writeObject(java.io.ObjectOutputStream s)

throws java.io.IOException {

// Write out any hidden serialization magic

s.defaultWriteObject();

// Write out HashMap capacity and load factor

s.writeInt(map.capacity());

s.writeFloat(map.loadFactor());

// Write out size

s.writeInt(map.size());

// Write out all elements in the proper order.

for (Iterator i=map.keySet().iterator(); i.hasNext(); )

s.writeObject(i.next());

}

// java.io.Serializable的读取函数

// 将HashSet的“总的容量,加载因子,实际容量,所有的元素”依次读出

private void readObject(java.io.ObjectInputStream s)

throws java.io.IOException, ClassNotFoundException {

// Read in any hidden serialization magic

s.defaultReadObject();

// Read in HashMap capacity and load factor and create backing HashMap

int capacity = s.readInt();

float loadFactor = s.readFloat();

map = (((HashSet)this) instanceof LinkedHashSet ?

new LinkedHashMap(capacity, loadFactor) :

new HashMap(capacity, loadFactor));

// Read in size

int size = s.readInt();

// Read in all elements in the proper order.

for (int i=0; i

E e = (E) s.readObject();

map.put(e, PRESENT);

}

}

}

从上述HashSet源代码可以看出,它其实就是一个对HashMap的封装而已。所有放入HashSet中的集合元素实际上由HashMap的key来保存,而HashMap的value则存储了一个PRESENT,它是一个静态的Object对象。

HashSet的绝大部分方法都是通过调用HashMap的方法来实现的,因此HashSet和HashMap两个集合在实现本质上是对应的。

根据HashMap的一个特性: 将一个key-value放入HashMap中时,首先根据key的hashCode()返回值决定该Entry的存储位置,如果两个key的hash值相同,那么它们的存储位置相同。如果这个两个key的equalus比较返回true。那么新添加的Entry的value会覆盖原来的Entry的value,key不会覆盖。因此,如果向HashSet中添加一个已经存在的元素,新添加的集合元素不会覆盖原来已有的集合元素。

现在我们通过一个实际的例子来看看是否真正理解了HashMap和HashSet存储元素的细节:

class Name

{

private String first;

private String last;

public Name(String first, String last)

{

this.first = first;

this.last = last;

}

public boolean equals(Object o)

{

if (this == o)

{

return true;

}

if (o.getClass() == Name.class)

{

Name n = (Name)o;

return n.first.equals(first)

&& n.last.equals(last);

}

return false;

}

}

public class HashSetTest

{

public static void main(String[] args)

{

Set s = new HashSet();

s.add(new Name("abc", "123"));

System.out.println(

s.contains(new Name("abc", "123")));

}

}

上面程序中向HashSet里添加了一个new Name(“abc”,”123”)对象之后,立即通过程序判断该HashSet里是否包含一个new Name(“abc”,”123”)对象。粗看上去,很容易以为该程序会输出true。实际上会输出false。

因为HashSet判断两个对象相等的标准是先通过hashCode方法计算出其hash值,当hash值相同的时候才继续判断equals方法。而上面程序并没有重写hashCode方法。所以两个Name类的hash值并不相同,因此HashSet会把其当成两个对象来处理。(hashCode重写的一条约定:通过equals调用返回true的2个对象的hashCode一定一样。)

所以,当我们要将一个对象作为HashMap的key或者存储在HashSet的时候,必须正确重写hashCode和equals方法,符合java对于重写这两个方法的所有约定。

上面的Name类可以如下重写hashCode方法:

public void hashCode(){

return first.hashCode()+last.hashCode();

}

参考地址:http://blog.csdn.net/canot/article/details/51240251

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值