讨论集合关注的问题:
- 底层数据结构
- 增删改查方式
- 初始容量,扩容方式,扩容时机
- 线程安全与否
- 是否允许空,是否允许重复,是否有序
1. 概述
前篇,我写了关于Map系列的集合(点击跳转);本篇重新回顾Collection三大类Set、List、Queue中的Set。
Set可以视作是数学中集合的概念,也即集合中不能有重复的元素。Set集合中的各种实现集合,其内部都与Map有关,先对Map有了解更好。常见的Set集合有HashSet、LinkedHashSet和TreeSet,下面通过源码试着分析其内部构造。
2. HashSet
HashSet继承自AbstractSet,实现了Set接口,同时也是可克隆对象和进行序列化的。其内部的数据存储区通过一个transient修饰的HashMap
维护,也就是说HashSet中的数据是存放在HashMap中(回忆:HashMap中是通过一个transient的数组来存储不同的Hash值的key,相同的Key链成一个链表)。进行序列化时,不会序列化空的值。它维持它自己的内部排序,所以随机访问没有任何意义。
public class HashSet<E>
extends AbstractSet<E>
implements Set<E>, Cloneable, java.io.Serializable
{
static final long serialVersionUID = -5024744406713321676L;
private transient HashMap<E,Object> map;
// Dummy value to associate with an Object in the backing Map
private static final Object PRESENT = new Object();
/**
* Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
* default initial capacity (16) and lo