Java集合概览
Java集合,也叫做容器,又两大接口派生而来:一个是Collection接口,主要用于存放单一元素;另一个是Map接口,主要用于存放键值对。对于Collection接口下面又有三个主要的子接口:List、Set和Queue。
Java集合框架如下图所示:
注意:图中只列举了主要的继承派生关系,并没有列举所有关系。
List,Set,Queue,Map四者的区别
List(对付顺序的好帮手):存储的元素都是有序的、可重复的。
Set(注重独一无二的性质):存储的元素是无序的、不可重复的。
Queue(实现排队功能的叫号机):按特定的排队规则来确定先后顺序,存储的元素是有序的、可重复的。
Map(用key来搜索的专家):使用键值对(key-value)存储,类似于数学上的函数y=f(x),“x”代表key,“y”代表value,key是无序的、不可重复的,value是无序的、可重复的,每个键最多映射得到一个值。
集合框架底层数据结构总结
Collection接口下的集合(List、Set、Queue、Map)
List
ArrayList:object[] 数组
Vector:object[] 数组
LinkedList: 双向链表(JDK1.6之前为循环列表,JDK1.7取消了循环)
Set
HashSet(无序,唯一):基于HashMap实现的,底层采用HashMap来保存元素
LinkedHashSet:LinkedHashSet是HashSet的子类,并且其内部是通过LinkedHashMap来实现的。有点类似于我们之前说的LinkedHashMap,其内部是基于HashMap实现的一样,不过还是有一点区别的。
TreeSet(有序,唯一):红黑树(自平衡的排序二叉树)
Queue
PriorityQueue:Object[] 数组实现二叉堆;
ArrayQueue:Object[] 数组+双指针
再来看看Map接口下面的集合
Map
HashMap:JDK1.8之前HashMap由数组+链表组成的,数组是HashMap的主体,链表则是主要为了解决哈希冲突而存在的(“拉链法”解决冲突)。JDK1.8以后在解决哈希冲突时有了较大的变化,当链表长度大于阈值(默认为8)(将链表转化成红黑树前会判断,如果当前数组的长度小于64,那么会选择先进行数组扩容,而不是转换为红黑树)时,将链表转化为红黑树,以减少搜索时间。
LinkedHashMap:LinkedHashMap继承自HashMap,所以它的底层仍然是基于拉链式散列结构即由数组和链表或红黑树组成。另外,LinkedHashMap在上面结构的基础上,增加了一条双向链表,使得上面的结构可以保持键值对的插入顺序。同时通过对链表进行相应的操作,实现了访问顺序的相关逻辑。
Hashtable:数组+链表组成的,数组是Hashtable的主体,链表则是主要为了解决哈希冲突而存在的。
TreeMap:红黑树(自平衡的排序二叉树)
如何选用集合
主要根据集合的特点来选用,比如我们需要根据键值获取到元素值时就选用Map接口下的集合,需要排序时就选择TreeMap,不需要排序时就选择HashMap,需要保证线程安全就选用ConcurrHashMap。
当我们只需要存放元素值时,就选择实现Collection接口的集合,需要保证元素唯一时选择实现Set接口的集合比如TreeSet或HashSet,不需要就选择List接口的比如ArrayList或LinkedList,然后再根据实现这些接口集合的特点来选用。
为什么要使用集合?
当我们需要保存一组类型相容的数据的时候,我们应该是用一个容器来保存,这个容器就是数组,但是,使用数组存储对象具有一定的弊端,因为我们在实际开发中,存储的数据的类型是多种多样的,于是,就出现了“集合”,集合同样也是用来存储多个数据的。
数组的缺点是一旦声明之后,长度就不可变了;同时,声明数组时的数据类型也决定了该数组存储的数据类型;而且,数组存储的数据是有序的、可重复的,特点单一。但是集合提高了数据存储的灵活性,Java集合不仅可以用来存储不同类型不同数量的对象,还可以保存具有映射关系的数据。
Collect子接口之List
ArrayList和Vector的区别?
ArrayList是List的主要实现类,底层使用Object[]存储,适用于频繁的查找工作,线程不安全;
Vector是List的古老实现类,底层使用Object[]存储,线程安全。
ArrayList和LinkedList区别
1、是否保证线程安全:ArrayList和LinkedList都是不同步的,也就是不保证线程安全;
2、底层数据结构:ArrayList底层使用的是Object数组;LinkedList底层适用的是双向链表数据结构,JDK1.7取消了循环。注意双向链表和双向循环链表的区别)
3、插入和删除元素是否收到位置的影响:
ArrayList采用数组存储,所以插入和删除元素的时间复杂度受元素位置的影响。
LinkedList采用链表存储,所以,如果是在头尾插入或者删除元素不收元素位置影响,在指定位置插入和删除时间复杂度近似为O(n)。
4、是否支持快速随机访问:LinkedList不支持高效的随机元素访问,而ArrayList支持。快速随机访问就是通过元素的序号快速获取元素对象(对应于get(int index)方法)。
5、内存空间占用:ArrayList的空间浪费主要体现在list列表结尾会预留一定的容量空间,而LinkedList的空间花费体现在它的每一个元素都需要消耗比ArrayList更多的空间(因为要存放直接后继和直接前驱以及数据)。