集合(一)——从这里开始List、Set

最新推荐文章于 2021-04-06 05:13:43 发布

Previous.

最新推荐文章于 2021-04-06 05:13:43 发布

阅读量229

点赞数

分类专栏： Java基础文章标签： java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44145607/article/details/108318449

版权

Java基础专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Collection集合体系

Collection 是一个集合接口，

它提供了对集合对象进行基本操作的通用接口方法，

所有集合都是它的子类，比如 List、Set 等。

Collections 是一个包装类，

包含了很多静态方法，不能被实例化，就像一个工具类，

比如提供的排序方法： Collections. sort(list)。

Collections.sort排序内部原理

Collections.sort排序通过泛化实现对所有类型的排序。

对于基本数据类型按照字符表，数字大小排序；

对于自定义类型，通过Comparable接口，重写compareTo()自定义比较大小的方式。

Collections.sort内部调用的是Arrays.sort()

对于Arrays类有两种sort方法，sort(Object)使用归并排序，sort(int)使用快速排序。

jdk1.6中使用MergeSort

jdk1.7中使用TimSort=MergeSort + insertionSort

TimSort介绍

由Tim Peters于2002年使用在Python编程语言中。

该算法用于查找已经排序的数据的子序列，并使用该知识更有效地对其余部分进行排序。

这是通过将已识别的子序列（称为运行）与现有运行合并直到满足某些条件来完成的。

从版本2.3开始，Timsort一直是Python的标准排序算法。

如今，Timsort 已是是 Python、 Java、 Android平台和 GNU Octave 的默认排序算法。

List

List是有序可重复的

有三个实现类： ArrayList、LinkedList和Vector。

线性方式存储，索引方式访问，存取顺序一致。

1、ArrayList(数组)

继承自AbstractList

底层采用可变数组存储元素，支持索引，因此适合查询和遍历。

非线程安全，线程不同步，单线程访问集合

缺点：每个元素之间不能有间隔，列表的结尾会预留一定的容量空间，当数组大小不满足(增删操作)时，就要将已经有数组的数据复制、移动到新的存储空间，代价较高，因此，不适合增删

有初始容量大小，ArrayList扩容增长原来的0.5倍

2、LinkedList(链表)

继承自AbstractSquentialList

为了克服ArrayList不适合增删，LinkedList底层采用双向链表结构存储数据的，

每个元素通过引用相连，使得增删高效。(Jdk1.6循环链表；1.7双向链表)

还提供了List接口中没有定义的方法，专门用于操作表头和表尾元素，

可以当作堆栈、队列和双向队列使用。

由于底层是用双向链表实现的，没有初始化大小，也没有扩容的机制。

LinkedList空间浪费，在每一个元素都要消耗比ArrayList更多的空间，用来存放节点

双向链表：包含两个指针，一个prev指向前一个节点，一个next指向后一个节点

双向循环链表：最后一个节点的next指向head，head的prev指向最后一个节点，构成一个环。

双向链表-双向循环链表

3、Vector(数组)

Vector与ArrayList一样，也是通过数组实现的，

不同的是它支持线程的同步，即某一时刻只有一个线程能够写 Vector，

避免多线程同时写而引起的不一致性，但实现同步需要很高的花费，

因此，访问它比访问ArrayList慢。

增容时，增至原来的1倍

Set

该体系集合用于存储无序(存入和取出的顺序不一定相同)元素，值不能重复。

对象的相等性本质是对象hashCode值（java是依据对象的内存地址计算出的此序号）判断的，

如果想要让两个不同的对象视为相等的，就必须覆盖Object的hashCode方法和equals方法。

1、HashSet

HashSet实现原理：

HashSet是基于HashMap实现的，底层使用HashMap保存所有元素，

HashSet源码非常少，相关的操作基本上都是直接调用底层HashMap的方法来完成。

哈希表存放的是哈希值。

HashSet存储元素的顺序并不是按照存入时的顺序（和List显然不同）而是按照哈希值来存的所以取数据也是按照哈希值取得。

HashSet如何检查重复

元素的哈希值是通过元素的 hashcode方法来获取的,

HashSet首先判断两个元素的哈希值，如果哈希值一样，

接着会比较 equals方法如果 equls结果为true ，HashSet就视为同一个元素。

如果equals 为false就不是同一个元素。

哈希值相同equals为false的元素是怎么存储呢

就是在同样的哈希值下顺延（可以认为哈希值相同的元素放在一个哈希桶中）。

也就是哈希一样的存一列。HashSet通过hashCode值来确定元素在内存中的位置。

一个hashCode位置上可以存放多个元素。

2、LinkedHashSet(HashSet+LinkedHashMap)

对于 LinkedHashSet 而言，它继承自HashSet、又基于 LinkedHashMap 来实现的。

LinkedHashSet 底层使用 LinkedHashMap 来保存所有元素，它继承与 HashSet，其所有的方法操作上又与HashSet相同。

因此LinkedHashSet 的实现上非常简单，只提供了四个构造方法，并通过传递一个标识参数，调用父类的构造器，底层构造一个 LinkedHashMap来实现，在相关操作上与父类HashSet的操作相同，直接调用父类HashSet的方法即可。

可实现有序插入

3、TreeSet(二叉树)

继承自SortedSet，适合排序

存入元素时会与其他元素比较，用Comparable接口中的CompareTo()方法，存入对象的类实现接口，调用方法。

也可以用Comparator接口中的compara()方法比较字符串长度。

TreeSet()是使用二叉树的原理对新add()的对象按照指定的顺序排序（升序、降序），每增加一个对象都会进行排序，将对象插入的二叉树指定的位置。

Integer和String对象都可以进行默认的TreeSet排序，而自定义类的对象是不可以的，自己定义的类必须实现Comparable接口，并且覆写相应的compareTo()函数，才可以正常使用。

在覆写compare()函数时，要返回相应的值才能使TreeSet按照一定的规则来排序

比较此对象与指定对象的顺序。如果该对象小于、等于或大于指定对象，则分别返回负整数、零或正整数。

如果文章对你有帮助

记得点赞 + 分享

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
集合(一)——从这里开始List、Set

Collection集合体系Collection 是一个集合接口，它提供了对集合对象进行基本操作的通用接口方法，所有集合都是它的子类，比如 List、Set 等。Collections 是一个包装类，包含了很多静态方法，不能被实例化，就像一个工具类，比如提供的排序方法： Collections. sort(list)。Collections.sort排序内部原理 Collections.sort排序通过泛化实现对所有类型的排序。对于基本数据类型按照字符表，数字大小排序；...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。