Set集合的存储特点
1.首先Set集合中的元素是无序-存放和取出元素不按顺序(这里的顺序指的是存放的顺序)
2.其次Set集合中元素没有对应下标-意味着我们遍历该集合时不能够通过下标来进行遍历
3.最后Set集合中的元素是不可重复的-我们可以利用这个特性对一些数据(类库中定义的引用类型数据)进行去重
注:集合中只能存放引用类型数据
Set集合的常用实现类
1.HashSet 底层由哈希表(数组加链表)实现 | jdk1.2 | 线程不安全,效率高
2.LinkedHashSet 是HashSet的子类,底层同样由哈希表实现,但相较于HashSet添加了一个双向链表来记录元素的存放顺序,可以保证元素存取顺序一致 |jdk1.2| 线程不安全,效率高
3.TreeSet 底层由红黑树实现,可以对一些数据进行自动排序(存放元素的顺序)|jdk1.2|线程不安全,效率高
Set集合常用方法
除了与下标有关的方法,和List中大部分方法通用
Set集合的去重原理
为什么Set集合可以实现对元素的去重,对于前两个实现类是因为它们底层哈希表的结构从而实现去重,哈希表的去重原理如下:
哈希表的底层是数据库加链表的结构,当我们向Set集合中添加元素时,底层会通过hashCode方法来获取该元素的哈希码值,再将获取到的哈希码值对数组长度减一进行取余操作,从而获得元素在数组中存放的位置,当有相同元素存放时,它们的存放地址一致,这时会先判断当前位置是否有值,如果有值,就会通过调用equals方法来比较两者内容是否相同,如果相同就会放弃存放,如果不同就会在当前存放元素的后面链表存放。
注:这里我们还需要知道在jdk1.8之后如果元素之后链接的元素个数超过8个之后会将链表转换为树状结构,这是因为链表结构过长会影响查询效率。
Set集合遍历
三种方法
- 迭代器遍历
- 外遍历
- 自遍历
Set<Integer> set = new HashSet<>();
set.add(10);
set.add(20);
set.add(30);
set.add(40);
set.add(40);
//迭代器
Iterator<Integer> it = set.iterator();
while (it.hasNext()) {
System.out.print(it.next()+" ");
}
System.out.println();
//外遍历
for (Integer i : set) {
System.out.print(i+" ");
}
System.out.println();
//自遍历-匿名内部类
set.forEach(new Consumer<Integer>() {
@Override
public void accept(Integer i) {
System.out.print(i+" ");
}
});
System.out.println();
//自遍历-lambda
set.forEach(i-> System.out.print(i+" "));
TreeSet集合排序功能实现
-
对于类库中定义的引用类型排序
对于类库中定义的引用类型我们不需要在重写equals和hashCode方法,因为已经重写过,我们可以直接把对应类型数据存入集合即可 -
对于自定义类型排序
对于自定义类型,我们需要重写该类型的equals和hashCode方法,因为这两种方法默认比较的是地址,而我们排序都是通过该类中的某些数据进行的,因此需要对其进行重写,并且重写后还需要为TreeSet集合提供排序规则,对此有两种方式 -
第一种是该类直接实现Comparable<该类类名>接口,重写接口中的CompareTo方法,排序规则是
-
从小到大: this的值>o的值, 返回正数, 反之返回负数
-
从大到小: this的值>o的值, 返回负数, 反之返回正数
-
相等返回0
-
具体实现如下
public class Student implements Comparable<Student>{
private String name;
private int age;
private double score;
//省略getter & setter & 构造
@Override
public int compareTo(Student o) {
//根据学生成绩从低到高排序
if (this.score > o.score) {
return 1;
} else if (this.score < o.score) {
return -1;
}
return 0;
}
}
- 第二种实现Comparator接口, 重写compare方法,直接在定义TreeSet集合时传入接口实现类
Set<Student> set = new TreeSet<>((o1,o2)->{
//根据成绩从高到低排序
if (o1.getScore() > o2.getScore()) {
return -1;
} else if (o1.getScore()<o2.getScore()) {
return 1;
}
return 0;
});
注:对于TreeSet排序规则:在返回值为0时去重