手撕HashSet

HashSet 实现 Set 接口,内部维护一个 HashMap 实例。它不能保证集合迭代的顺序,也不能保证顺序不变。HashSet 允许 null 元素。

该类对于基本操作,例如 addremovecontainssize提供了常数时间的性能,迭代器的性能与 HashSet 实例的大小加上内部维护的 HashMap 的“容量”(即桶的数量)之和有关。所以,如果迭代性能很重要的话,并不建议把初始化容量设置的太大或者把负载因子设置的太小(HashMap 一文中有讲解)。

该集合并没有被同步,所以在有多个线程并发访问 HashSet 时,并且至少有一个集合修改了这个 Set ,它必须要额外的同步。这通常是对自然封装了该集合的某个对象进行同步来完成。比如 CollectionssynchronizedSet 方法返回的就是一个这样的对象。


初始化

初始化则主要是负责初始化内部维护的 HashMap,初始化策略遵循 HashMap 的初始化策略,默认大小为 16 ,负载因子为 0.75。


存取、删除操作

HashSet 中的基本操作是使用 HashMap 的操作实现的。

	public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }

	public boolean remove(Object o) {
        return map.remove(o)==PRESENT;
    }

	public void clear() {
        map.clear();
    }

PRESENTObject 对象的实例,是为 HashMapvalue 虚设的。尽管 HashMapvalue 可以为 null,但是这里不适用 null 的原因很简单,因为使用 null ,则在 addremove 操作时会产生歧义,无法区分 HashMap 中是否已经存在过旧的值。


迭代器

HashSet 的迭代器仍然是快速失败的,快速失败很好理解,在并发情况下,存在线程修改容器,那么其它正在迭代容器的线程将尽最大可能抛出 ConcurrentModificationException。从字面意思来看,依赖该异常来进行编程并不是很好的选择,我们可能不能够及时得到这个异常,仅仅将它用来检查 bug 还是可行的。

	public Iterator<E> iterator() {
        return map.keySet().iterator();
    }

可以发现,HashSet 的迭代器直接使用的 HashMapkeySet 方法返回的其内部实现的 KeySet 对象实例的迭代器。前文有提到关于迭代器性能的问题,这是与 HashMap 特殊的底层数据结构有关(数组+链表或者数组+红黑树),无论是哪种,遍历都是先从数组中的第一个元素(即“桶”)开始,接着遍历桶中的元素,直到整个数组遍历完成。所以,其性能和数组的大小加上元素数量之和有关。


总结

HashSet 的实现代码比较少,主要原因是因为实现依赖了内部维护的 HashMap


我与风来


认认真真学习,做思想的产出者,而不是文字的搬运工
错误之处,还望指出

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值