Set集合
Set接口是Collection的子接口,set接口没有提供额外的方法。但是比Collection接口更加严格了。
Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个 Set 集合中,则添加操作失败。
Set集合支持的遍历方式和Collection集合一样:foreach和Iterator。
Set的常用实现类有:HashSet、TreeSet、LinkedHashSet。
HashSet
Set接口的框架:
|---Collection接口:单列集合,用来存储一个一个的对象。
|---Set接口:存储无序的、不可重复的数据。
|---HashSet:作为Set接口的主要实现类:线程不安全的;可以存储null值
|---LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历
对于频繁的遍历操作,LinkedHashSet效率高于HashSet。
|---TreeSet:可以按照添加对象的指定属性,进行排序。
1.Set接口中没有额外定义新的方法,使用的都是Collection中声明过的方法。
一、Set:存储无序的,不可重复的数据
1.无序性:不等于随机性。存储的数据底层数组中并非按照数组索引的顺序添加,而是根据数据的哈希值进行存储的。
2.不可重复性:不能添加相同的元素。保证添加的元素按照了equals()判断时,不能返回true。即相同的元素只能添加一个。
二、添加元素的过程:以HashSet为例:
我们向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,此哈希值接着
通过某种算法计算出在HashSet底层数组中存放的位置(即为索引位置),判断数组此位置上是否已经有元素:
1.如果此位置上没有其它元素,此元素添加成功。--->情况1
2.如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:
2.1如果hash值不相同,则元素a添加成功。--->情况2
2.2如果hash值相等,进而需要调用元素a所在类的equals()方法:
2.2.1 equals()返回true,则元素a添加失败。
2.2.2 equals()返回false,则元素a添加成功。--->情况3
3.对于添加成功的情况2和情况3而言:元素a与已经存在指定索引位置上数据以链表的方式存储时。
jdk 7 :元素a放到数组中,指向原来的元素。
jdk 8 :原来的元素放到数组中,指向元素a。
总结:七上八下
HashSet底层:数组+链表的结构。(前提:jdk7)
/**
* Set接口的框架:
* |---Collection接口:单列集合,用来存储一个一个的对象。
* |---Set接口:存储无序的、不可重复的数据。
* |---HashSet:作为Set接口的主要实现类:线程不安全的;可以存储null值
* |---LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历
* |---TreeSet:可以按照添加对象的指定属性,进行排序。
* 1.Set接口中没有额外定义新的方法,使用的都是Collection中声明过的方法。
*
*/
/**
* 一、Set:存储无序的,不可重复的数据
* 1.无序性:不等于随机性。存储的数据底层数组中并非按照数组索引的顺序添加,而是根据数据的哈希值进行存储的。
*
* 2.不可重复性:不能添加相同的元素。保证添加的元素按照了equals()判断时,不能返回true。即相同的元素只能添加一个。
*
* 二、添加元素的过程:以HashSet为例:
* 我们向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,此哈希值接着
* 通过某种算法计算出在HashSet底层数组中存放的位置(即为索引位置),判断数组此位置上是否已经有元素:
*
* 1.如果此位置上没有其它元素,此元素添加成功。--->情况1
* 2.如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:
* 2.1如果hash值不相同,则元素a添加成功。--->情况2
* 2.2如果hash值相等,进而需要调用元素a所在类的equals()方法:
* 2.2.1 equals()返回true,则元素a添加失败。
* 2.2.2 equals()返回false,则元素a添加成功。--->情况3
* 3.对于添加成功的情况2和情况3而言:元素a与已经存在指定索引位置上数据以链表的方式存储时。
* jdk 7 :元素a放到数组中,指向原来的元素。
* jdk 8 :原来的元素放到数组中,指向元素a。
* 总结:七上八下
*
*/
@Test
public void tests1(){
HashSet set = new HashSet();
set.add(123);
set.add(456);
set.add(12344);
set.add(789);
set.add(123);
set.add(null);
System.out.println(set.size());//5
System.out.println(set);//[null, 789, 456, 12344, 123],打印出的顺序跟添加时的顺序不一致,
// 添加了两个123,但是只打印出了一个123,体现了不可重复性。
//遍历
Iterator iterator = set.iterator();
while (iterator.hasNext()) {
System.out.print(iterator.next()+";");//null;789;456;12344;123;打印出的顺序跟添加时的顺序不一致,即无序性
}
}
HashSet 是 Set 接口的典型实现,大多数时候使用 Set 集合时都使用这个实现类。
java.util.HashSet底层的实现其实是一个java.util.HashMap支持,然后HashMap的底层物理实现是一个Hash表。
HashSet 按 Hash 算法来存储集合中的元素,因此具有很好的存取和查找性能。HashSet 集合判断两个元素相等的标准:两个对象通过 hashCode() 方法比较相等,并且两个对象的 equals() 方法返回值也相等。因此,存储到HashSet的元素要重写hashCode和equals方法。
LinkedHashSet
LinkedHashSet继承于HashSet,在添加数据的同时,每个数据还维护了两个引用,记录此数据前一个数据和后一个数据。
优点:对于频繁的遍历操作,LinkedHashSet效率高于HashSet。
LinkedHashSet是HashSet的子类,它在HashSet的基础上,在结点中增加两个属性before和after维护了结点的前后添加顺序。java.util.LinkedHashSet,它是链表和哈希表组合的一个数据存储结构。LinkedHashSet插入性能略低于 HashSet,但在迭代访问 Set 里的全部元素时有很好的性能。
LinkedHashSet<String> set = new LinkedHashSet<>();
set.add("张三");
set.add("李四");
set.add("王五");
set.add("张三");
System.out.println("元素个数:" + set.size());
for (String name : set) {
System.out.println(name);
}
运行结果:
元素个数:3
张三
李四
王五
TreeSet
1.向TreeSet中添加的数据,要求是相同的类的对象。
2.两种排序方式:自然排序(实现Comparable接口)和定制排序(实现Coparator接口)。
3.自然排序中,比较两个对象是否相同的标准为:compareTo()返回0.不在是equals()。
4.定制排序中,比较两个对象是否相同的标准为:compare()返回0.不在是equals()。
底层结构:里面维护了一个TreeMap,都是基于红黑树实现的!
特点:
不允许重复。
实现排序:自然排序或定制排序。
如何实现去重的?
如果使用的是自然排序,则通过调用实现的compareTo方法
如果使用的是定制排序,则通过调用比较器的compare方法
如何排序?
方式一:自然排序
让待添加的元素类型实现Comparable接口,并重写compareTo方法
方式二:定制排序
创建Set对象时,指定Comparator比较器接口,并实现compare方法
自然排序
如果试图把一个对象添加到 TreeSet 时,则该对象的类必须实现 Comparable 接口。实现 Comparable 的类必须实现 compareTo(Object obj) 方法,两个对象即通过 compareTo(Object obj) 方法的返回值来比较大小。对于 TreeSet 集合而言,它判断两个对象是否相等的唯一标准是:两个对象通过 compareTo(Object obj) 方法比较返回值为0。
定制排序
如果放到TreeSet中的元素的自然排序(Comparable)规则不符合当前排序需求时,或者元素的类型没有实现Comparable接口。那么在创建TreeSet时,可以单独指定一个Comparator的对象。使用定制排序判断两个元素相等的标准是:通过Comparator比较两个元素返回了0。