上一节对List接口下的ArrayList和LinkedList实现类的底层数据结构、扩容机制、线程安全简要做了一个分析,这一节我们来看一下Set接口下的实现类
一、Set接口下主要有两个实现类,分别是HashSet和TreeSet
1、HashSet的底层是HashMap
private transient HashMap<E,Object> map;
// Dummy value to associate with an Object in the backing Map
private static final Object PRESENT = new Object();
/**
* Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
* default initial capacity (16) and load factor (0.75).
*/
public HashSet() {
map = new HashMap<>();
}
HashSet添加元素的方法
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
通过源码我们可以很清晰的看出,在HashSet中添加元素依然是使用了HashMap中的put方法,HashSet的key就是要添加的元素e,value是一个常量空对象PRESENT
,key可以为null,但只能存一个null值。
HashSet是如何添加元素的?
HashSet添加元素时,会先计算出对象的hashcode,判断插入的位置,同时也会与其他已插入元素的hashcode作比较,如果值不相等,插入成功;如果相等,调用equals()方法,如果两个对象不相同,插入成功,如果两个对象相同,插入失败。
判断HashSet中是否包含某元素:
public boolean contains(Object o) {
return map.containsKey(o);
}
由于HashSet具有无序、不可重复的性质,所以也常常用HashSet做某些算法的去重工作。
HashSet的删除方法:
public boolean remove(Object o) {
return map.remove(o)==PRESENT;
}
HashSet具有以下特点:
(1)唯一、无序(这里的无序指存入元素的顺序和输出时的顺序不一致)
(2)判断两个元素是否相等调用了equals方法
(3)是HashMap的皮包类,线程不安全
LinkedHashSet继承自HashSet,底层数据结构是双向链表,有序
2、TreeSet是基于TreeMap实现的,它的底层是红黑树(自排序的平衡二叉树),是Set接口下SortedSet下NavigableSet的实现类
TreeSet默认构造器:调用了TreeMap的构造器
public TreeSet() {
this(new TreeMap<E,Object>());
}
...
public TreeMap() {
comparator = null;
}
TreeSet对添加的元素(类型须一致)会以红黑树
的形式排序存储,有两种排序方式:自然排序和定制排序,自然排序要求添加的元素实现Comparable
接口,实现compareTo()方法,obj1.compareTo(obj2)方法返回0表明两个元素大小相等,返回整数表明obj1大于obj2,返回负数表明obj1小于obj2;
//String类实现的compareTo方法,用于比较两个字符串的大小
public int compareTo(String anotherString) {
int len1 = value.length;
int len2 = anotherString.value.length;
int lim = Math.min(len1, len2);
char v1[] = value;
char v2[] = anotherString.value;
int k = 0;
while (k < lim) {
char c1 = v1[k];
char c2 = v2[k];
if (c1 != c2) {
return c1 - c2;
}
k++;
}
return len1 - len2;
}
定制排序需要在TreeSet构造方法中声明一个comparator
,实现Comparator接口下的compare()方法
//TreeSet构造器
public TreeSet(Comparator<? super E> comparator) {
this(new TreeMap<>(comparator));
}
...
int compare(T o1, T o2);