HashSet类是Set接口的实现类,其底层数据结构是哈希表。本篇文章,我们一起来学习关于HashSet的知识。
一、HashSet集合概述
(1)特点
① 底层数据结构是哈希表
② 对集合的迭代顺序不作任何保证,也就是说不保证存储和取出的元素顺序一致
③ 没有索引,所以不能使用普通的for循环
④ 由于是Set集合,所以是不包含重复元素的集合
(2)练习
import java.util.HashSet;
/*
* HashSet特点
* 底层是哈希表
* 对集合的迭代顺序不做任何保障
* 没有索引。不能使用普通的for循环
* Set集合没有重复元素
*
* */
public class HashSetTest {
public static void main(String[] args) {
HashSet<String> strings = new HashSet<String>();
strings.add("Tom");
strings.add("Jim");
strings.add("Mike");
for (String str:strings) {
System.out.println(str);
}
}
}
二、哈希表
在JDK8之前,底层是采用数组+链表实现的,可以说是一个元素为链表的数组。
在JDK8之后,底层是采用数组+链表/红黑树实现的,当链表长度大于8的时候变为红黑树(目的就是查询快)。
这里主要研究,再存储元素时,是怎么保证元素唯一性的!
首先根据哈希值找位置,
如果该位置没有元素,直接存储,如果有元素,先比较哈希值是否相同。
如果不同,则向下存储,如果相同,则比较元素内容是否相同,
如果不同,则向下存储,如果相同,则证明重复,不存储。
三、HashSet保证元素唯一性的分析
其大体过程为,hashSet的add方法在存储元素时,然后调用内部put方法,计算一下元素的哈希值(和hashCode相关),然后在put方法里调用putVal方法将元素哈希值和元素一起传递,最后在putVal方法中完成一系列操作,在这个方法中,创建一个哈希表,初始化哈希表,然后根据对象的哈希值计算对象的存储位置,如果该位置没有元素,就存储该元素,如果有元素,那么就需要存入的元素和以前的元素比较哈希值,如果哈希值不同,会把元素添加进集合,如果相同,会调用对象的equals方法进行比较,如果返回false,把元素添加到集合,如果返回true,说明元素重复,不存储。
这里就需要重写hashCode()和equals()
四、哈希值
(1)定义:哈希值是JDK根据对象的地址或者字符串或者数字算出来的int类型的数值。
在Object类中就有一个方法可以获取对象的哈希值
public int hashCode();//返回对象的哈希码值。
/*
* 哈希值,在Object类中的hashcode()方法返回的是int型数值
* */
public class HashCodeTest {
public static void main(String[] args) {
Student student = new Student();
Student student1 = new Student();
System.out.println(student.hashCode());//303563356
System.out.println(student1.hashCode());//135721597不同对象的哈希值是不一样的
//但是如果重写student类中的hashCode方法,可以实现相同的值
//String重写了hashcode方法,所以存在不同对象结果存在同样值的情况。
System.out.println("tom".hashCode());//115026
System.out.println("jim".hashCode());//105230
System.out.println("tom".hashCode());//115026
System.out.println("重地".hashCode());// 760156
System.out.println("通话".hashCode());// 731582
}
}
(2)对象哈希值的特点
① 同一个对象多次调用hashCode()方法返回的哈希值是相同的。
② 默认情况下,不同对象的哈希值是不同的,而重写hashCode()方法,可以实现让不同对象的哈希值相同。
五、案例练习
使用HashSet集合存储学生信息,保证唯一性
import java.util.HashSet;
/*
* 使用HashSet集合
* 存储Student
* 并展示存储的信息
* */
public class Demo2 {
public static void main(String[] args) {
HashSet<Student> students = new HashSet<Student>();
Student s1 = new Student("tom",12);
Student s2 = new Student("jim",15);
Student s3 = new Student("mike",14);
Student s4 = new Student("mike",14);
students.add(s1);
students.add(s2);
students.add(s3);
students.add(s4);
for (Student s :students) {
System.out.println(s);
}
}
}
这样输出是还是四条记录,所以要重写Student的equals和hashCode方法,这里也是需要注意的一点就是,我们在自己编写对象的时候,如果使用HashSet保证集合元素唯一性是需要自己重写equals和hashCode方法的
public class Student {
String name;
int age;
public Student(String name, int age) {
this.name = name;
this.age = age;
}
public Student() {}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
Student student = (Student) o;
if (age != student.age) return false;
return name != null ? name.equals(student.name) : student.name == null;
}
@Override
public int hashCode() {
int result = name != null ? name.hashCode() : 0;
result = 31 * result + age;
return result;
}
@Override
public String toString() {
return "学生{" +
"姓名='" + name + '\'' +
", 年龄=" + age +
'}';
}
}
在IDEA中直接使用Generate中选择这两个方法,一路next就可以自动生成了。