Set也是一个接口,他实现了Collection和Iterable两个接口,因此,Set是一个集合,同时,我们也可以使用迭代器遍历Set。
Set是一个接口,我们当然不能实例化接口,所以,我们一般实际使用的Set有:
- HashSet
- LinkedHashSet
- TreeSet
HashSet
HashSet存储元素的策略,是使用一中称为“散列表”的数据结构,因此,HashSet中元素的遍历是没有顺序的。而通过散列表来存储元素时,都必须首先调用元素的hashCode方法来判断,得出的值我们叫做哈希码。当我们像HashSet存储一个元素的时候,HashSet会首先检查元素的哈希码,如果哈希码指向的位置为空,则元素可以加进去;如果指向的位置不为空,这就说明了HashSet中有某个元素与这个元素的哈希码相同,这时候就调用equal方法进行两个元素的比较,如果比较的结果不相同,此元素也可以加进HashSet;如果equals比较的结果还是相同,那么就不能添加此元素。也就是说,每次添加元素都会进行hashCode方法的调用,而不一定会调用equals方法,这就大大的提高了程序的效率。同时,这也告诉我们,如果我们自己定义的类要使用HashSet来管理对象,就一定要重写hashCode和equals方法。重写的原则就是保证相同的对象返回的哈希码是相同的,equals返回的值是true。
使用HashSet的优点就是:查询效率特别的高,而且在增删元素的时候,效率也很高,因为是通过哈希码来实现的。
使用HashSet的缺点就是:使用的空间比较大,这是为了避免散列冲突。
LinkedHashSet
其实和HashSet差不多,就是在HashSet之前加了一个Linked,也就是说,他还是实现了元素的顺序,而不像HashSet的随机。其实,LinkedHashSet就是HashSet的子类。与HashSet不同的就是,LinkedHashSet还有一个双重列表(即 Linked)。也就是说,我们使用Iterator遍历LinkedHashSet的时候,不再是随机的,而是按照我们添加元素的顺序。
TreeSet
TreeSet其实跟HashSet差不多,区别如下:
- 对于TreeSet的遍历,是有顺序而言的,而且这个顺序是我们可以控制的;而对HashSet遍历,则是没有顺序的。
- TreeSet增删元素的速度比HashSet慢。这一点在小数量的元素中看不错来,但是在大量的元素中,就比较明显。
刚刚说了,我们可以对于TreeSet的遍历顺序进行控制,那么是怎么控制的呢?其实,就是在我们自定义的类中实现compareTo方法。此方法回来一个 int 类型的整数。如果返回负值,则排在后面,如果返回正值,则在前面,如果返回0,则两个元素相等,而Set是不允许有重复的元素的,所以这点也保证了Set中元素的唯一性。
HashSet是个链表数组。每一个数组元素就是一个列表,我们称为散列表元 。