(一)概述
java.util.Set接口继承自Collection接口,它与Collection接口中的方法基本一致,并没有对Collection接口进行功能上的扩充,只是比Collection接口更加严格了。Set接口中元素无序,并且都会以某种规则保证存入的元素不重复。
主要包含的实现类有:HashSet、TreeSet、LinkedHashSet ...
- HashSet
- 原理
用Hash技术实现的Set结构。
由于Set集合是不能存入重复元素的集合。那么HashSet也是具备这一特性的。
HashSet如何检查重复?HashSet会通过元素的hashcode()和equals()方法进行判断元素师否重复。
当你试图把对象加入HashSet时,HashSet会使用对象的hashCode来判断对象加入的位置。同时也会与其他已经加入的对象的hashCode进行比较,如果没有相等的hashCode,HashSet就会假设对象没有重复出现。
简单一句话,如果对象的hashCode值是不同的,那么HashSet会认为对象是不可能相等的。
因此我们自定义类的时候需要重写hashCode,来确保对象具有相同的hashCode值。
如果元素(对象)的hashCode值相同,是不是就无法存入HashSet中了? 当然不是,会继续使用equals 进行比较.如果 equals为true 那么HashSet认为新加入的对象重复了,所以加入失败。如果equals 为false那么HashSet 认为新加入的对象没有重复.新元素可以存入。
- 散列技术原理
把对象的主键直接用一个固定的公式计算,得出存储位置的方法。
优点是:可以快速命中搜索的目标。
在JDK1.8之前,哈希表底层采用数组+链表实现,即使用链表处理冲突,同一hash值的链表都存储在一个链表里。但是当位于一个桶中的元素较多,即hash值相等的元素较多时,通过key值依次查找的效率较低。而JDK1.8中,哈希表存储采用数组+链表+红黑树实现,当链表长度超过阈值(8)时,将链表转换为红黑树,这样大大减少了查找时间。
JDK1.8引入红黑树大程度优化了性能。
- 使用
1 基本数据类型存入HashSet中
HashSet set = new HashSet();
set.add(100);
set.add(200);
set.add(300);
set.add(400);
set.add(500);
set.add(400); // 不会存入重复数据
2 字符串类型数据存入HashSet中
HashSet set = new HashSet();
set.add("aaa");
set.add("bbb");
set.add("ccc");
set.add("ddd");
set.add("aaa");// 不会存入重复数据
3 自定义类型存入HashSet中
class Student{
private String name;
private int age;
public Student(){
}
public Student(String name, int age) {
super();
this.name = name;
this.age = age;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
}
public class TestHashSet {
public static void main(String[] args) {
HashSet hs = new HashSet();
Stu