集合(一)——从这里开始List、Set



Collection集合体系


collection


Collection 是一个集合接口,

它提供了对集合对象进行基本操作的通用接口方法,

所有集合都是它的子类,比如 List、Set 等。


Collections 是一个包装类,

包含了很多静态方法,不能被实例化,就像一个工具类,

比如提供的排序方法: Collections. sort(list)。


Collections.sort排序内部原理

Collections.sort排序通过泛化实现对所有类型的排序。

对于基本数据类型按照字符表,数字大小排序;

对于自定义类型,通过Comparable接口,重写compareTo()自定义比较大小的方式。


Collections.sort内部调用的是Arrays.sort()

对于Arrays类有两种sort方法,sort(Object)使用归并排序,sort(int)使用快速排序。

jdk1.6中使用MergeSort

jdk1.7中使用TimSort=MergeSort + insertionSort

TimSort介绍

由Tim Peters于2002年使用在Python编程语言中。

该算法用于查找已经排序的数据的子序列,并使用该知识更有效地对其余部分进行排序。

这是通过将已识别的子序列(称为运行)与现有运行合并直到满足某些条件来完成的。

从版本2.3开始,Timsort一直是Python的标准排序算法。

如今,Timsort 已是是 Python、 Java、 Android平台 和 GNU Octave 的默认排序算法。






List


List是有序可重复的

有三个实现类: ArrayList、LinkedList和Vector。

线性方式存储,索引方式访问,存取顺序一致。


1、ArrayList(数组)

继承自AbstractList

底层采用可变数组存储元素,支持索引,因此适合查询和遍历。

非线程安全,线程不同步,单线程访问集合

缺点:每个元素之间不能有间隔,列表的结尾会预留一定的容量空间,当数组大小不满足(增删操作)时,就要将已经有数组的数据复制、移动到新的存储空间,代价较高,因此,不适合增删

有初始容量大小,ArrayList扩容增长原来的0.5倍


2、LinkedList(链表)

继承自AbstractSquentialList

为了克服ArrayList不适合增删,LinkedList底层采用双向链表结构存储数据的,

每个元素通过引用相连,使得增删高效。(Jdk1.6循环链表;1.7双向链表)

还提供了List接口中没有定义的方法,专门用于操作表头和表尾元素,

可以当作堆 栈、队列和双向队列使用。

由于底层是用双向链表实现的,没有初始化大小,也没有扩容的机制。

LinkedList空间浪费,在每一个元素都要消耗比ArrayList更多的空间,用来存放节点

双向链表:包含两个指针,一个prev指向前一个节点,一个next指向后一个节点

双向循环链表:最后一个节点的next指向head,head的prev指向最后一个节点,构成一个环。

双向链表-双向循环链表

3、Vector(数组)

Vector与ArrayList一样,也是通过数组实现的,

不同的是它支持线程的同步,即某一时刻只有一个线程能够写 Vector,

避免多线程同时写而引起的不一致性,但实现同步需要很高的花费,

因此,访问它比访问ArrayList慢。

增容时,增至原来的1倍






Set


该体系集合用于存储无序(存入和取出的顺序不一定相同)元素,值不能重复。

对象的相等性本质是对象hashCode值(java是依据对象的内存地址计算出的此序号)判断的,

如果想要让两个不同的对象视为相等的,就必须覆盖Object的hashCode方法和equals方 法。


1、HashSet

HashSet实现原理:

HashSet是基于HashMap实现的,底层使用HashMap保存所有元素,

HashSet源码非常少,相关的操作基本上都是直接调用底层HashMap的方法来完成。

哈希表存放的是哈希值。

HashSet存储元素的顺序并不是按照存入时的顺序(和List显然不同)而是按照哈希值来存的所以取数据也是按照哈希值取得。


HashSet如何检查重复

元素的哈希值是通过元素的 hashcode方法来获取的,

HashSet首先判断两个元素的哈希值,如果哈希值一样,

接着会比较 equals方法 如果 equls结果为true ,HashSet就视为同一个元素。

如果equals 为false就不是同一个元素。


哈希值相同equals为false的元素是怎么存储呢

就是在同样的哈希值下顺延(可以认为哈希值相 同的元素放在一个哈希桶中)。

也就是哈希一样的存一列。HashSet通过hashCode值来确定元素在内存中的位置。

一个hashCode位置上可以存放多个元 素。



2、LinkedHashSet(HashSet+LinkedHashMap)

对于 LinkedHashSet 而言,它继承自HashSet、又基于 LinkedHashMap 来实现的。

LinkedHashSet 底层使用 LinkedHashMap 来保存所有元素,它继承与 HashSet,其所有的方法 操作上又与HashSet相同。

因此LinkedHashSet 的实现上非常简单,只提供了四个构造方法,并通过传递一个标识参数,调用父类的构造器,底层构造一个 LinkedHashMap来实现,在相关操作上与父类HashSet的操作相同,直接调用父类HashSet的方法即可。

可实现有序插入



3、TreeSet(二叉树)

继承自SortedSet,适合排序

存入元素时会与其他元素比较,用Comparable接口中的CompareTo()方法,存入对象的类实现接口,调用方法。

也可以用Comparator接口中的compara()方法比较字符串长度。

TreeSet()是使用二叉树的原理对新add()的对象按照指定的顺序排序(升序、降序),每增加一个对象都会进行排序,将对象插入的二叉树指定的位置。

Integer和String对象都可以进行默认的TreeSet排序,而自定义类的对象是不可以的,自己定义的类必须实现Comparable接口,并且覆写相应的compareTo()函数,才可以正常使用。

在覆写compare()函数时,要返回相应的值才能使TreeSet按照一定的规则来排序

比较此对象与指定对象的顺序。如果该对象小于、等于或大于指定对象,则分别返回负整数、零或正整数。



如果文章对你有帮助
记得点赞 + 分享

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值