java集合类是java中一个重要的知识体系模块。集合顾名思义是一堆数据的组成储存容器。相比于数组,集合更加灵活,不用初始化定义大小,集合内存会在存储空间使用完后进行自动扩容(这是一个比较耗费性能的事情),集合的存储数据类型更为广泛。
首先我们来看一下集合的整体的架构图。集合的顶端是一个Iterator。 下层分为 Collection接口和Map接口。Collection下分为Queue接口、List接口、Set接口。 Map下分为AbstractMap、SortedMap接口。
接下来我们来分别分析一下List、Set、Map
List是java中非常常用的数据类型。 List是有序的Collection。 List接口下面有三个实现类 ArrayList、Vector、LinkedList
ArrayList(数组)
ArrayList是最常用的List实现类,内部是通过数组实现的。它允许对元素进行快速的随机访问。数组的缺点是每个元素之间不能有间隔,当数组大小不满足存储时,就要将已有的数组的数据复制到新的存储空间。当ArrayList的中间位置需要删除或者插入元素时,需要对数据进行复制和移动、代价较大。数组本是是有下标,所以通过下标定位查找数据速度很快。 综上,ArrayList适合随机查找和遍历,不适合插入和删除操作。
Vector(数组实现、线程同步)
Vector和ArrayList一样内部通过数组实现,不同的是它支持线程同步,即不管在某一时刻只有一个线程可以写Vector。可以避免多线程时的数据不一致性问题,相应也用性能作为代价保证了同步,所以它的效率比ArrayList要低
LinkedList(链表)
LinkedList是用链表结构存储数据的,很适合动态的插入和删除,随机访问和遍历效率较慢。另外还提供了专门操作表头和表尾的元素,可以当作堆栈、队列使用。
Set注重独一无二的性质,该体系结合用于存储无序元素,值不能重复。(对象相等性本质是对象的hashcode值,java依据对象的内存地址计算出的此序号)
HashSet(Hash表)
哈希表里面存放的是哈希值,HashSet存储元素的顺序并不是按照存入时的顺序(和List不同)而是按照哈希值来存,所以取值的时候也是按照哈希值取的。元素的哈希值时通过hashcode方法来获取的。HashSet首先判断两个元素的哈希值,如果哈希值一样,接着比较equals方法如果equals结果为true,HashSet就视为同一个元素。如果equals为false就不是同一个元素。
那么哈希值相同 equlas为false的元素是怎么存储呢,就是在同样的哈希值下顺延(可以认为哈希值相同的元素放在一个哈希桶中),也就是哈希一样的存一列。
一个hashcode位置上可以存放多个hashcode相同的元素。
TreeSet(二叉树)
TreeSet是使用二叉树的原理对新添加的对象按照指定的顺序排序,每增加一个对象都会进行排序,将对象插入到二叉树指定的位置。
Integer和String对象都可以进行默认的TreeSet排序,而自定义类的对象是不可以的,自己定义的类必须实现Comparable接口,并且覆写相应的compareTo函数,才可以正常使用。
在覆盖comepare函数时,要返回对应的值才能时TreeSet按照一定的顺序返回
比较此对象与指定对象的顺序,如果该对象小于、等于、大于指定对象,则返回负整数、0、正整数。
LinkedHashSet(HashSet+LinkedHashMap)
对于LinkedHashSet而言,它继承了与HashSet又基于LinkedHashMap来实现的,LinkedHashSet底层使用LinkedHashMap来保存所有数据,它继承与HashSet,其所有方法操作上与HashSet原理相同
Map 是用来存储键值对的一种数据结构
HashMap(数组+链表+红黑树)
HashMap根据相同的hashcode值存储数据,大多数情况下可以直接定位到它的值,因而具有很快的访问速度,但遍历顺序确不确定,HashMap最多允许一条记录的键为nukk,允许多条记录的值为null,HashMap非线程安全,可以用Collections的SynchronizedMap方法使HashMap具有线程安全的能力,或者使用ConcurrentHashMap。
HashTable(线程安全)
HashTable是遗留类,常用的功能和HashMap类似,继承自Dictionary类,是线程安全的。
TreeMap(可排序)
TreeMap实现自SortedMap接口,能把保存的记录根据键排队,默认是按照值升序,也可以选择指定的排序比较器,当用Iterator遍历TreeMap的时候,得到的记录是排过序的。
LinkedHashMap(记录插入顺序)
LinkedHashMap是HashMap的子类,保存了记录的插入顺序,在用Iterator遍历的时候,先得到的记录是先插入的,也可以在构造时带参,按照访问的次序排序。