java的集合都被放在java.util包中,主要有四种List、Queue、Set和Map,下面对其做一些 简单的介绍
1. List(可重复)
-
ArrayList(基于数组实现,增删慢,查询快,线程不安全)
ArrayLsist是使用的最广泛的List实现类, 其内部的数据结构是基于数组实现的,提供了基于List的add、remove、get(访问)功能。缺点:元素必须连续存储,但需要在ArrayList的中间位置插入一个或者删除一个元素时,需要将待插入或者删除的节点后的所有元素向后移动,其修改改价高,因此不适合随机插入和删除的工作,更适合随机查找和遍历的操作
ArrayList不需要在定义时,指定其长度,当自己的容量不够时,会自己扩容,将原来的数据复制到新的数组中,默认的容量是10,接下来看一点源码关于底层的原理
public ArrayList(int initialCapacity) { if (initialCapacity > 0) { this.elementData = new Object[initialCapacity]; } else if (initialCapacity == 0) { this.elementData = EMPTY_ELEMENTDATA; } else { throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity); } }
这是其中一个构造器,所以底层就是Object[]
-
Vector(基于数组实现,增删慢,查询快,线程安全)
Vector的数据结构和ArrayList一样,都是基于数组实现的,不同的是Vector支持线程同步,同意时刻只允许一个线程对Vector进行写操作,以保证多线程环境下数据的一致性,但需要频繁地对Vector进行加锁和释放,使得读写效率整体上比ArrayList低,因为里面大部分的方法都有synchronized关键字修饰 -
LinkedList(基于双向链表实现,增删快,查询慢,线程不安全)
采用双向链表结构来存储元素,在对LinkedList进行插入和删除操作的时候,只需要在对应的节点上插入和删除元素,并在上一个元素的下一个节点的指针指向该节点,数据改动较小,因此随机改动和删除的效率很高。但对LinkedList进行随机访问的同时,需要从链表头部一直遍历到该节点为止,因此访问的速度很慢。另外LinkedList还有在LIst中没有的方法,用于操作链表的额头部和尾部的元素,因此这个有时候可以被用来当做栈或者队列使用
transient int size = 0;
/**
* Pointer to first node.
* Invariant: (first == null && last == null) ||
* (first.prev == null && first.item != null)
*/
transient Node<E> first;
/**
* Pointer to last node.
* Invariant: (first == null && last == null) ||
* (last.next == null && last.item != null)
*/
transient Node<E> last;
/**
* Constructs an empty list.
*/
这是LinkedList底层,维护的数据结构只有头节点和尾节点,对应节点的具体如下
private static class Node<E> {
E item;
Node<E> next;
Node<E> prev;
Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}
2. Queue(先进先出)
常用的队列
ArrayBlockingQueue //基于数组数据结构实现的有界阻塞队列
LinkedBlockingQueue // 基于链表数据结构实现的有界阻塞队列
PriorityBlockingQueue // 支持优先级排序的无界阻塞队列
DelayQueue // 支持延迟操作的无界阻塞队列
SynchronousQueue // 用于线程同步的阻塞队列
LinkedTransferQueue // 基于链表数据结构实现的无界阻塞队列
LinkedBlockingDeque // 基于链表数据结构实现的双向阻塞队列
3. Set (不可重复)
set的核心特性是独一无二,适用于存储无序且值不相等的元素。对象的相等性在本质上是对象的 HashCode值相同,java依据对象的内存地址计算出的对象的HashCode值。如果需要比较两个对象是否相等,就必须同时覆盖对象的hashCode方法和equals方法,并且它们的返回值必须相同,同为false或者true
-
HashSet:HashMap实现,无序
HashSet存放的是散列值,它是按照元素的散列值来存取元素的。元素的散列值是通过hashCode方法计算的,HashSet首先判断两个元素的散列值是否相等,如果散列值相等,如果equals方法返回的结果也为true,HashSet就视为同一个元素,如果equals方法返回的结果为False,视为不同的元素,只使用了HashMap的Key,默认容量是16。static final long serialVersionUID = -5024744406713321676L; private transient HashMap<E,Object> map; // Dummy value to associate with an Object in the backing Map private static final Object PRESENT = new Object(); /** * Constructs a new, empty set; the backing <tt>HashMap</tt> instance has * default initial capacity (16) and load factor (0.75). */ public HashSet() { map = new HashMap<>(); }
-
TreeSet:二叉树实现
基于二叉树的原理对新添加的对象按照指定的顺序排序,每添加一个对象都会排序,并将对象插入二叉树的指定位置Interger和String基础对象可以直接根据TreeSET的默认排序惊喜存储,而自定义的数据对象必须实现Comparable接口,并且覆盖其中的compareTo函数,次才能按照预定义的顺序存储。如果重写这个函数,则在升序的时候this.对象应该小于指定对象的条件下返回-1,在降序时在this.对象大于指定对象的条件下返回1
-
LinkHashSet:继承HashSet,HashMap实现数据存储,双向链表记录顺序
底层使用LinkedHashMap存储元素,所有的操作和方法都与HashSet相同
4. Map
- HashMap:数组 + 链表存储数据,线程不安全
HashMap基于见的HashCode值唯一标识一条数据,同时基于键的HashCode值进行数据的存取,因此可以快速的更新和查询数据,但其每次遍历的顺序无法保证相同。
是非线程安全的,同一时刻可以用多个线程同时写HashSet,如果需要满足线程安全的条件,则可以使用Collections的synchronizedMap方法使其有线程安全的能力,或者使用ConcurrentHashMap
HashMap在查找数据的时候,根据HashMap的Hash值可以快速定位到数组的具体下表,但是找到数组下表后还需要链表进行顺序遍历,所以时间复杂度为O(n)
为了防范碰撞攻击,减少链表遍历的开销,Java对其实现了优化,但链表的长度大于8,会自动转为红黑树,或者数据结构为 数组 + 链表或者红黑树,这样时间复杂度是log2N - HashTable线程安全
很多功能都和HashMap相似,不同的是继承至Dictionary类,并且是线程安全的,同一时刻只有一个线程能写HashTable,并发性不如ConcurrentHashMap。 - TreeMap基于二叉树数据结构
TreeMap基于二叉树存储数据,同时实现了SortedMap接口以保障元素的顺序存取,默认按键值的升序排序,也可以自定义排序器
TreeMap常用于实现排序的映射列表。在使用TreeMap时其Key必须实现Comparable接口或者采用自定义的比较器,否则会抛出java.lang.ClassCastException异常 - LinkedHashMap:继承HashMap,使用链表保存插入顺序