凯哥带你从零学大数据系列之Java篇---第十八章:集合(Set)

课程重点:

  • Set的存储特点
  • 数据结构-哈希表(了解)
  • 数据结构-二叉树(了解)
  • TreeSet的排序去重(了解)
  • HashSet的去重

18.1. 存储特点

  • Set集合中,没有下标的概念。
  • Set集合,是一个去重复的集合。 在Set集合中不会添加重复的元素的!
    在向一个Set集合中添加元素的时候, 会先判断这个元素是否已经存在了。 如果存在, 则不再添加。
  • Set集合中, 数据的存储是无序的。
    无序: 所谓的无序, 其实指的是元素的添加顺序和存储顺序是不一致的。
    无序, 并不意味着随机!

Set接口, 是继承自Collection接口的。 Set接口中的方法, 都是从Collection接口中继承下来的, 并没有添加新的方法。

18.2. 哈希表

Set集合的两个实现类HashSet与LinkedHashSet,底层实现都是哈希表。

  • Hash,一般翻译做“散列”,也有直接音译为“哈希”的,它是基于快速存取的角度设计的,也是一种典型的“空间换时间”的做法。顾名思义,该数据结构可以理解为一个线性表,但是其中的元素不是紧密排列的,而是可能存在空隙。
  • 散列表(Hash table,也叫哈希表),是根据键值码值(Key value)而直接进行访问的数据结构。也就是说,它通过把键值码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数。
  • Hash表的组成是”数组+链表”这些元素是按照什么样的规则存储到数组中呢。一般情况是通过hash(key)%len获得,也就是元素的key的哈希值对数组长度取模得到。

比如下图哈希表中,12%16=12,28%16=12,108%16=12,140%16=12。所以12、28、108以及140都存储在数组下标为12的位置

18.3. 二叉树

  • 二叉树是一种非常重要的数据结构,它同时具有数组和链表各自的特点:它可以像数组一样快速查找,也可以像链表一样快速添加。但是他也有自己的缺点:删除操作复杂。
  • 二叉树:是每个结点最多有两个子树的有序树,在使用二叉树的时候,数据并不是随便插入到节点中的,一个节点的左子节点的关键值必须小于此节点,右子节点的关键值必须大于或者是等于此节点,所以又称二叉查找树、二叉排序树、二叉搜索树。
  • 叉树遍历分为三种
    • 先序遍历
      首先访问根,再先序遍历左子树,最后先序遍历右子树
    • 中序遍历
      首先中序遍历左子树,再访问根,最后中序遍历右子树
    • 后序遍历
      首先后序遍历左子树,再后序遍历右子树,最后访问根

18.4. TreeSet的排序

18.4.1. TreeSet的简介

TreeSet是一个Set接口的实现类,底层实现是二叉树。这样的集合,会对添加进集合的元素进行去重的处理。 同时, 这个集合会对添加进入的元素进行自动的升序排序。

18.4.2. Comparable接口

如果某一个类实现这个接口, 表示自己实现了一个可以和自己的对象进行大小比较的规则。 此时, 这个类的对象就可以直接存储进TreeSet集合中了。 因为此时TreeSet集合已经知道了怎么对两个这个类的对象进行大小比较。

/**
 * @Description
 */
public class Person implements Comparable<Person> {
    String name;
    int age;
    int score;
    int height;
    int weight;

    public Person(String name, int age, int score, int height, int weight) {
        this.name = name;
        this.age = age;
        this.score = score;
        this.height = height;
        this.weight = weight;
    }

    @Override
    public String toString() {
        return "Person{" +
                "name='" + name + '\'' +
                ", age=" + age +
                ", score=" + score +
                ", height=" + height +
                ", weight=" + weight +
                '}';
    }

    /**
     * 制定了大小比较的规则
     * @param o 和this进行比较的Person对象
     * @return 比较结果
     *      > 0 :   this > o
     *      ==0 :   this == o
     *      < 0 :   this < o
     */
    @Override
    public int compareTo(Person o) {
        return this.age - o.age;
    }
}

class TreeSetUsage2 {
    public static void main(String[] args) {
        // 1. 实例化一个TreeSet对象
        TreeSet<Person> sets = new TreeSet<>();

        sets.add(new Person("xiaoming", 10, 100, 165, 50));
        sets.add(new Person("xiaohong", 11, 99, 164, 50));
        sets.add(new Person("xiaolan", 9, 98, 164, 51));
        sets.add(new Person("xiaolv", 8, 98, 166, 48));
        sets.add(new Person("xiaozi", 10, 97, 159, 46));

        // 2. 遍历集合
        sets.forEach(System.out::println);
        System.out.println(sets.size());
    }
}

18.4.3. Comparator接口

在实例化TreeSet集合对象的时候,可以通过Comparator进行实例化。 此时, 这个集合有着自己的排序的依据, 与集合中存储的元素对应的类无关。 此时集合中存储的元素对应的类, 可以不实现Comparable接口, 依然可以完成排序。 即便这个类真的实现了Comparable接口, 最终的排序结果依然以构造方法中的Comparator为准。

/**
 * @Description 通过Comparator进行比较
 */
public class TreeSetUsage3 {
    public static void main(String[] args) {
        // 1. 实例化一个TreeSet对象
        //    可以通过Comparator进行TreeSet的实例化。使用指定的规则进行大小比较。
        //    此时,集合中存储的元素可以不实现Comparable接口
        TreeSet<Person> sets = new TreeSet<>((p1, p2) -> p1.height - p2.height);

        sets.add(new Person("xiaoming", 10, 100, 165, 50));
        sets.add(new Person("xiaohong", 11, 99, 164, 50));
        sets.add(new Person("xiaolan", 9, 98, 164, 51));
        sets.add(new Person("xiaolv", 8, 98, 166, 48));
        sets.add(new Person("xiaozi", 10, 97, 159, 46));

        // 2. 遍历集合
        sets.forEach(System.out::println);
        System.out.println(sets.size());
    }
}

18.4.4. Comparable与Comparator的使用场景

  • 如果这个对象, 在项目中大多数的情况下, 都采用相同的大小比较的方式。 比如: 一个Person类, 在大多数情况下, 都是按照年龄进行大小比较的。 此时就可以让Person类实现Comparable接口。
  • 如果某一个类的对象, 在临时进行大小比较的时候, 使用的与默认的比较不一样的规则。 比如: 一个Person类, 大多数情况下, 都是使用的年龄进行大小比较的, 但是临时需要使用身高进行一次比较, 此时就可以使用 Comparator 临时完成了。 而且, Comparator的优先级要高于Comparable。

18.5. Set集合的去重原理

18.5.1. HashSet & LinkedHashSet

18.5.2. TreeSet

无论使用Comparator还是Comparable,如果两个对象进行大小比较的结果是0, 此时代表这两个对象是相同的对象。 在TreeSet中会完成排重的处理。

注意: TreeSet中元素的去重只与对象的大小比较结果有关。 与hashCode()、equals(), 没有任何关系。

展开阅读全文
实付0元
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值