java comparator_凯哥带你从零学大数据系列之Java篇---第十八章:集合(Set)

ec5ca482c179e4fb2c1c0b36815e6369.png

温馨提示:如果想学扎实,一定要从头开始看凯哥的一系列文章(凯哥带你从零学大数据系列),千万不要从中间的某个部分开始看,知识前后是有很大关联,否则学习效果会打折扣.

系列文章第一篇是拥抱大数据:凯哥带你从零学大数据系列-学习大数据前奏(必读)(点我)!

上一篇:拥抱大数据:凯哥带你从零学大数据系列之Java篇---第十七章:集合(List)

课程重点:

  • Set的存储特点
  • 数据结构-哈希表(了解)
  • 数据结构-二叉树(了解)
  • TreeSet的排序去重(了解)
  • HashSet的去重

18.1. 存储特点

  • Set集合中,没有下标的概念。
  • Set集合,是一个去重复的集合。 在Set集合中不会添加重复的元素的!
    在向一个Set集合中添加元素的时候, 会先判断这个元素是否已经存在了。 如果存在, 则不再添加。
  • Set集合中, 数据的存储是无序的。
    无序: 所谓的无序, 其实指的是元素的添加顺序和存储顺序是不一致的。
    无序, 并不意味着随机!

Set接口, 是继承自Collection接口的。 Set接口中的方法, 都是从Collection接口中继承下来的, 并没有添加新的方法。

18.2. 哈希表

Set集合的两个实现类HashSet与LinkedHashSet,底层实现都是哈希表。

  • Hash,一般翻译做“散列”,也有直接音译为“哈希”的,它是基于快速存取的角度设计的,也是一种典型的“空间换时间”的做法。顾名思义,该数据结构可以理解为一个线性表,但是其中的元素不是紧密排列的,而是可能存在空隙。
  • 散列表(Hash table,也叫哈希表),是根据键值码值(Key value)而直接进行访问的数据结构。也就是说,它通过把键值码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数。
  • Hash表的组成是”数组+链表”这些元素是按照什么样的规则存储到数组中呢。一般情况是通过hash(key)%len获得,也就是元素的key的哈希值对数组长度取模得到。

比如下图哈希表中,12%16=12,28%16=12,108%16=12,140%16=12。所以12、28、108以及140都存储在数组下标为12的位置

cf213bdb9c080cbfb4d5009eef4d88e7.png

18.3. 二叉树

  • 二叉树是一种非常重要的数据结构,它同时具有数组和链表各自的特点:它可以像数组一样快速查找,也可以像链表一样快速添加。但是他也有自己的缺点:删除操作复杂。
  • 二叉树:是每个结点最多有两个子树的有序树,在使用二叉树的时候,数据并不是随便插入到节点中的,一个节点的左子节点的关键值必须小于此节点,右子节点的关键值必须大于或者是等于此节点,所以又称二叉查找树、二叉排序树、二叉搜索树。
  • 叉树遍历分为三种
    • 先序遍历
      首先访问根,再先序遍历左子树,最后先序遍历右子树
    • 中序遍历
      首先中序遍历左子树,再访问根,最后中序遍历右子树
    • 后序遍历
      首先后序遍历左子树,再后序遍历右子树,最后访问根

6cbeb2531b27a65d1462a2b691a01c22.png

18.4. TreeSet的排序

18.4.1. TreeSet的简介

TreeSet是一个Set接口的实现类,底层实现是二叉树。这样的集合,会对添加进集合的元素进行去重的处理。 同时, 这个集合会对添加进入的元素进行自动的升序排序。

18.4.2. Comparable接口

如果某一个类实现这个接口, 表示自己实现了一个可以和自己的对象进行大小比较的规则。 此时, 这个类的对象就可以直接存储进TreeSet集合中了。 因为此时TreeSet集合已经知道了怎么对两个这个类的对象进行大小比较。

/**

18.4.3. Comparator接口

在实例化TreeSet集合对象的时候,可以通过Comparator进行实例化。 此时, 这个集合有着自己的排序的依据, 与集合中存储的元素对应的类无关。 此时集合中存储的元素对应的类, 可以不实现Comparable接口, 依然可以完成排序。 即便这个类真的实现了Comparable接口, 最终的排序结果依然以构造方法中的Comparator为准。

/**

18.4.4. Comparable与Comparator的使用场景

  • 如果这个对象, 在项目中大多数的情况下, 都采用相同的大小比较的方式。 比如: 一个Person类, 在大多数情况下, 都是按照年龄进行大小比较的。 此时就可以让Person类实现Comparable接口。
  • 如果某一个类的对象, 在临时进行大小比较的时候, 使用的与默认的比较不一样的规则。 比如: 一个Person类, 大多数情况下, 都是使用的年龄进行大小比较的, 但是临时需要使用身高进行一次比较, 此时就可以使用 Comparator 临时完成了。 而且, Comparator的优先级要高于Comparable。

18.5. Set集合的去重原理

18.5.1. HashSet & LinkedHashSet

94a00d5912f6ad545226ecd84e8f7b5d.png

18.5.2. TreeSet

无论使用Comparator还是Comparable,如果两个对象进行大小比较的结果是0, 此时代表这两个对象是相同的对象。 在TreeSet中会完成排重的处理。

注意: TreeSet中元素的去重只与对象的大小比较结果有关。 与hashCode()、equals(), 没有任何关系。

看完啦,你需要接着看

拥抱大数据:凯哥带你从零学大数据系列之Java篇---第十九章:集合(Map+Collections)​zhuanlan.zhihu.com
068bfc202061b34d5143b80d40175138.png

继续加油吧!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值