Set 基本与Collection 相同,没有提供额外的方法,实际上Set就是Collection ,只是行为略有不同(Set不允许包含重复元素)
重点介绍HashSet和TreeSet,这两种Set是日常工作中用的比较多的,在面试的过程中也会涉及。
目录
HashSet 通过hashcod保存 访问 查询速度比较快,效率比较高
补充: 如果向HashSet中添加可变元素对象后,后续程序修改了对象的实列变量,则可能导致集合中其他元素相同(及两个对象通过equals() 方法比较返回true,两个对象的hashcod()值也相等)。如果修改对象的值,对象的保存位置不变,此时可能无法通过Hashcode 访问对象。应为计算的hashcod 与保存的位置无法对应。
HashSet的实现原理其实是HashMap,相对于HashMap有单独的key和value,HashSet的key其实也是value。具体的原理后续介绍HashMap的时候再详述。HashSet的增删改查操作如下:
增:HashSet调用add方法增加元素,那HashSet是如何找到插入的位置呢?根据对象的hashCode方法和存储的数据的长度的与运算找到插入的位置(HashMap的底层实现是一个数组和链表实现的)。当调用的hashCode生成的值一样的时候就产生了冲突,这就需要在链表上增加元素。在这里有个非常重要的概念需要明白,什么是对象的相等性?在HashSet插入的对象都需要实现hashCode和equals方法,只有当hashcode相同和equal返回为true的时候才认为对象是相等的。HashCode也是用hashcode和equal来判断元素的重复性的。当两个对象的hashcode相同并且equals为false的时候就产生了冲突,需在链表上增加元素,和LinkedList的一样时间复杂度为O(n),如没有冲突时间复杂度为O(1)。所以在实现hashCode和equals需保证,尽量保证hashcode分散性一般是元素的属性乘以素数,并且equals相等的对象,hashcode也必须相同,不然程序会出现意想不到的情况。
删:更加对象的hashcode找到元素的位置,如果该hashCode桶产生了冲突,查找的原理和LinkedList一样,时间复杂度为O(n),如果没有产生冲突,时间复杂度为O(1)。
改:查了java的文档,貌似HashSet没有提供直接的修改操作。间接的做法是先删后增。
查:HashSet只能通过Iteartor遍历元素。
---| Itreable 接口 实现该接口可以使用增强for循环
---| Collection 描述所有集合共性的接口
---| List接口 可以有重复元素的集合
---| ArrayList
---| LinkedList
---| Set接口 不可以有重复元素的集合
---| HashSet 线程不安全,存取速度快。底层是以哈希表实现的。
哈希表边存放的是哈希值。HashSet存储元素的顺序并不是按照存入时的顺序(和List显然不同) 是按照哈希值来存的所以取数据也是按照哈希值取得。
HashSet不存入重复元素的规则.使用hashcode和equals
由于Set集合是不能存入重复元素的集合。那么HashSet也是具备这一特性的。HashSet如何检查重复?HashSet会通过元素的hashcode()和equals方法进行判断元素师否重复。
当你试图把对象加入HashSet时,HashSet会使用对象的hashCode来判断对象加入的位置。同时也会与其他已经加入的对象的hashCode进行比较,如果没有相等的hashCode,HashSet就会假设对象没有重复出现。
简单一句话,如果对象的hashCode值是不同的,那么HashSet会认为对象是不可能相等的。
因此我们自定义类的时候需要重写hashCode,来确保对象具有相同的hashCode值。
如果元素(对象)的hashCode值相同,是不是就无法存入HashSet中了? 当然不是,会继续使用equals 进行比较.如果 equals为true 那么HashSet认为新加入的对象重复了,所以加入失败。如果equals 为false那么HashSet 认为新加入的对象没有重复.新元素可以存入.
总结:
元素的哈希值是通过元素的hashcode方法 来获取的, HashSet首先判断两个元素的哈希值,如果哈希值一样,接着会比较equals方法 如果 equls结果为true ,HashSet就视为同一个元素。如果equals 为false就不是同一个元素。
哈希值相同equals为false的元素是怎么存储呢,就是在同样的哈希值下顺延(可以认为哈希值相同的元素放在一个哈希桶中)。也就是哈希一样的存一列。
hashtable
图1:hashCode值不相同的情况
图2:hashCode值相同,但equals不相同的情况。
HashSet:通过hashCode值来确定元素在内存中的位置。一个hashCode位置上可以存放多个元素。
当hashcode() 值相同equals() 返回为true 时,hashset 集合认为这两个元素是相同的元素.只存储一个(重复元素无法放入)。调用原理:先判断hashcode 方法的值,如果相同才会去判断equals 如果不相同,是不会调用equals方法的。
HashSet到底是如何判断两个元素重复。
通过hashCode方法和equals方法来保证元素的唯一性,add()返回的是boolean类型
判断两个元素是否相同,先要判断元素的hashCode值是否一致,只有在该值一致的情况下,才会判断equals方法,如果存储在HashSet中的两个对象hashCode方法的值相同equals方法返回的结果是true,那么HashSet认为这两个元素是相同元素,只存储一个(重复元素无法存入)。
注意:HashSet集合在判断元素是否相同先判断hashCode方法,如果相同才会判断equals。如果不相同,是不会调用equals方法的。
HashSet 和ArrayList集合都有判断元素是否相同的方法,
boolean contains(Object o)
HashSet使用hashCode和equals方法,ArrayList使用了equals方法
案例:
使用HashSet存储字符串,并尝试添加重复字符串
回顾String类的equals()、hashCode()两个方法。
- public class Demo4 {
- public static void main(String[] args) {
- // Set 集合存和取的顺序不一致。
- Set hs = new HashSet();
- hs.add("世界军事");
- hs.add("兵器知识");
- hs.add("舰船知识");
- hs.add("汉和防务");
- // 返回此 set 中的元素的数量
- System.out.println(hs.size()); // 4
- // 如果此 set 尚未包含指定元素,则返回 true
- boolean add = hs.add("世界军事"); // false
- System.out.println(add);
- // 返回此 set 中的元素的数量
- System.out.println(hs.size());// 4
- Iterator it = hs.iterator();
- while (it.hasNext()) {
- System.out.println(it.next());
- }
- }
- }
使用HashSet存储自定义对象,并尝试添加重复对象(对象的重复的判定)
- public class Demo4 {
- public static void main(String[] args) {
- HashSet hs = new HashSet();
- hs.add(new Person("jack", 20));
- hs.add(new Person("rose", 20));
- hs.add(new Person("hmm", 20));
- hs.add(new Person("lilei", 20));
- hs.add(new Person("jack", 20));
- Iterator it = hs.iterator();
- while (it.hasNext()) {
- Object next = it.next();
- System.out.println(next);
- }
- }
- }
- class Person {
- private String name;
- private int age;
- Person() {
- }
- public Person(String name, int age) {
- this.name = name;
- this.age = age;
- }
- public String getName() {
- return name;
- }
- public void setName(String name) {
- this.name = name;
- }
- public int getAge() {
- return age;
- }
- public void setAge(int age) {
- this.age = age;
- }
- @Override
- public int hashCode() {
- System.out.println("hashCode:" + this.name);
- return this.name.hashCode() + age * 37;
- }
- @Override
- public boolean equals(Object obj) {
- System.out.println(this + "---equals---" + obj);
- if (obj instanceof Person) {
- Person p = (Person) obj;
- return this.name.equals(p.name) && this.age == p.age;
- } else {
- return false;
- }
- }
- @Override
- public String toString() {
- return "Person@name:" + this.name + " age:" + this.age;
- }
- }
- 问题:现在有一批数据,要求不能重复存储元素,而且要排序。ArrayList 、 LinkedList不能去除重复数据。HashSet可以去除重复,但是是无序。
- 所以这时候就要使用TreeSet了
TreeSet
- 案例:使用TreeSet集合存储字符串元素,并遍历
- public class Demo5 {
- public static void main(String[] args) {
- TreeSet ts = new TreeSet();
- ts.add("ccc");
- ts.add("aaa");
- ts.add("ddd");
- ts.add("bbb");
- System.out.println(ts); // [aaa, bbb, ccc, ddd]
- }
- }
---| Itreable 接口 实现该接口可以使用增强for循环
---| Collection 描述所有集合共性的接口
---| List接口 有序,可以重复,有角标的集合
---| ArrayList
---| LinkedList
---| Set接口 无序,不可以重复的集合
---| HashSet 线程不安全,存取速度快。底层是以hash表实现的。
---| TreeSet 红-黑树的数据结构,默认对元素进行自然排序(String)。如果在比较的时候两个对象返回值为0,那么元素重复。
红-黑树
红黑树是一种特定类型的二叉树
红黑树算法的规则: 左小右大。
既然TreeSet可以自然排序,那么TreeSet必定是有排序规则的。
1:让存入的元素自定义比较规则。
2:给TreeSet指定排序规则。
方式一:元素自身具备比较性
元素自身具备比较性,需要元素实现Comparable接口,重写compareTo方法,也就是让元素自身具备比较性,这种方式叫做元素的自然排序也叫做默认排序。
方式二:容器具备比较性
当元素自身不具备比较性,或者自身具备的比较性不是所需要的。那么此时可以让容器自身具备。需要定义一个类实现接口Comparator,重写compare方法,并将该接口的子类实例对象作为参数传递给TreeMap集合的构造方法。
注意:当Comparable比较方式和Comparator比较方式同时存在时,以Comparator的比较方式为主;
注意:在重写compareTo或者compare方法时,必须要明确比较的主要条件相等时要比较次要条件。(假设姓名和年龄一直的人为相同的人,如果想要对人按照年龄的大小来排序,如果年龄相同的人,需要如何处理?不能直接return 0,因为可能姓名不同(年龄相同姓名不同的人是不同的人)。此时就需要进行次要条件判断(需要判断姓名),只有姓名和年龄同时相等的才可以返回0.)
通过return 0来判断唯一性。
问题:为什么使用TreeSet存入字符串,字符串默认输出是按升序排列的?因为字符串实现了一个接口,叫做Comparable 接口.字符串重写了该接口的compareTo 方法,所以String对象具备了比较性.那么同样道理,我的自定义元素(例如Person类,Book类)想要存入TreeSet集合,就需要实现该接口,也就是要让自定义对象具备比较性.
存入TreeSet集合中的元素要具备比较性.
比较性要实现Comparable接口,重写该接口的compareTo方法
TreeSet属于Set集合,该集合的元素是不能重复的,TreeSet如何保证元素的唯一性
通过compareTo或者compare方法中的来保证元素的唯一性。
添加的元素必须要实现Comparable接口。当compareTo()函数返回值为0时,说明两个对象相等,此时该对象不会添加进来。
比较器接口
----| Comparable
compareTo(Object o) 元素自身具备比较性
----| Comparator
compare( Object o1, Object o2 ) 给容器传入比较器
TreeSet集合排序的两种方式:
一,让元素自身具备比较性。
也就是元素需要实现Comparable接口,覆盖compareTo 方法。
这种方式也作为元素的自然排序,也可称为默认排序。
年龄按照搜要条件,年龄相同再比姓名。
- public class Demo4 {
- public static void main(String[] args) {
- TreeSet ts = new TreeSet();
- ts.add(new Person("aa", 20, "男"));
- ts.add(new Person("bb", 18, "女"));
- ts.add(new Person("cc", 17, "男"));
- ts.add(new Person("dd", 17, "女"));
- ts.add(new Person("dd", 15, "女"));
- ts.add(new Person("dd", 15, "女"));
- System.out.println(ts);
- System.out.println(ts.size()); // 5
- }
- }
- class Person implements Comparable {
- private String name;
- private int age;
- private String gender;
- public Person() {
- }
- public Person(String name, int age, String gender) {
- this.name = name;
- this.age = age;
- this.gender = gender;
- }
- public String getName() {
- return name;
- }
- public void setName(String name) {
- this.name = name;
- }
- public int getAge() {
- return age;
- }
- public void setAge(int age) {
- this.age = age;
- }
- public String getGender() {
- return gender;
- }
- public void setGender(String gender) {
- this.gender = gender;
- }
- @Override
- public int hashCode() {
- return name.hashCode() + age * 37;
- }
- public boolean equals(Object obj) {
- System.err.println(this + "equals :" + obj);
- if (!(obj instanceof Person)) {
- return false;
- }
- Person p = (Person) obj;
- return this.name.equals(p.name) && this.age == p.age;
- }
- public String toString() {
- return "Person [name=" + name + ", age=" + age + ", gender=" + gender
- + "]";
- }
- @Override
- public int compareTo(Object obj) {
- Person p = (Person) obj;
- System.out.println(this+" compareTo:"+p);
- if (this.age > p.age) {
- return 1;
- }
- if (this.age < p.age) {
- return -1;
- }
- return this.name.compareTo(p.name);
- }
- }
二,让容器自身具备比较性,自定义比较器。
需求:当元素自身不具备比较性,或者元素自身具备的比较性不是所需的。
那么这时只能让容器自身具备。
定义一个类实现Comparator 接口,覆盖compare方法。
并将该接口的子类对象作为参数传递给TreeSet集合的构造函数。
当Comparable比较方式,及Comparator比较方式同时存在,以Comparator
比较方式为主。
- public class Demo5 {
- public static void main(String[] args) {
- TreeSet ts = new TreeSet(new MyComparator());
- ts.add(new Book("think in java", 100));
- ts.add(new Book("java 核心技术", 75));
- ts.add(new Book("现代操作系统", 50));
- ts.add(new Book("java就业教程", 35));
- ts.add(new Book("think in java", 100));
- ts.add(new Book("ccc in java", 100));
- System.out.println(ts);
- }
- }
- class MyComparator implements Comparator {
- public int compare(Object o1, Object o2) {
- Book b1 = (Book) o1;
- Book b2 = (Book) o2;
- System.out.println(b1+" comparator "+b2);
- if (b1.getPrice() > b2.getPrice()) {
- return 1;
- }
- if (b1.getPrice() < b2.getPrice()) {
- return -1;
- }
- return b1.getName().compareTo(b2.getName());
- }
- }
- class Book {
- private String name;
- private double price;
- public Book() {
- }
- public String getName() {
- return name;
- }
- public void setName(String name) {
- this.name = name;
- }
- public double getPrice() {
- return price;
- }
- public void setPrice(double price) {
- this.price = price;
- }
- public Book(String name, double price) {
- this.name = name;
- this.price = price;
- }
- @Override
- public String toString() {
- return "Book [name=" + name + ", price=" + price + "]";
- }
- }
四,LinkedHashSet
会保存插入的顺序。
看到array,就要想到角标。
看到link,就要想到first,last。
看到hash,就要想到hashCode,equals.
看到tree,就要想到两个接口。Comparable,Comparator。
---------------------
作者:飘走的我
来源:CSDN
原文:https://blog.csdn.net/qq_33642117/article/details/52040345
版权声明:本文为博主原创文章,转载请附上博文链接!