列表和队列
一)ArrayList
1.基本原理
ArrayList是一个泛型容器。内部会有一个数组elementData,一般会有预留空间
有一个整数记录实际的元素个数。
private transientObject[] elementData;private int size;
2.迭代
1)foreach:
foreach的背后,编译器会把它转换为:
Iterator it =intList.iterator();while(it.hasNext()){
System.out.println(it.next());
}
只要对象实现了Iterable接口,就可以使用foreach语法。
另外除了iterator()方法,ArrayList还提供了两个返回Iterator的方法:
public ListIteratorlistIterator() //返回的迭代从0开始public ListIterator listIterator(int index) //返回的迭代从指定的index开始
ListIterator扩展了Iterator接口:
public interface ListIterator extends Iterator{booleanhasPrevious();
E previous();intnextIndex();intpreviousIndex();voidset(E e);voidadd(E e);
}
2)迭代的陷阱
1)在迭代的时候调用容器的删除方法:
public classTest {public static voidmain(String[] args) {
Integer[] arr= new Integer[] {1, 2, 3, 111, 666, 999};
ArrayList list = new ArrayList(Arrays.asList(arr));
remove(list);//java.util.ConcurrentModificationException 并发修改异常
}private static void remove(ArrayListlist) {for(Integer i : list) {if (i < 100) list.remove(i);
}
}
}
因为迭代器内部会维护一些索引位置相关的数据,要求在迭代的
过程中,容器不能发生结构性变化(添加、删除和插入元素),
否则索引的位置就失效了。解决办法:
private static void remove2(ArrayListlist) {
Iterator it =list.iterator();while(it.hasNext()) {if (it.next() < 100) {
it.remove();
}
}
}
3)迭代的原理
略
4)迭代器的优势
从封装的思路上讲,迭代器封装了各种数据组织方式的迭代操作,提供了简单一致的接口。
3.ArrayList实现的接口
1)Collection
Collection表示一个数据集合,数据间没有位置或顺序的概念。
public interface Collection extends Iterable{intsize();booleanisEmpty();booleancontains(Object o);
Iteratoriterator();
Object[] toArray();T[] toArray(T[] a);booleanadd(E e);booleanremove(Object o);boolean containsAll(Collection>c);boolean addAll(Collection extends E>c);boolean removeAll(Collection>c);boolean retainAll(Collection>c);voidclear();booleanequals(Object o);inthashCode();
}
2)List
List表示有顺序或者位置的数据集合,它扩展了Collection。
boolean addAll(int index, Collection extends E>c);
E get(intindex);
E set(intindex, E element);void add(intindex, E element);
E remove(intindex);intindexOf(Object o);intlastIndexOf(Object o);
ListIteratorlistIterator();
ListIterator listIterator(intindex);
List subList(int fromIndex, int toIndex);
这些方法都与位置有关。
3)RandomAccess
public interfaceRandomAccess {
}
居然没有定义任何代码,这种没有任何代码的接口称为标记接口,用于声明类的一种属性。
这里实现了RandomAccess接口的类表示可以随机访问,可随机访问就是具备类似数组数组
那样的特性,数据在内存中是连续存放的,根据索引值就可以定位到具体的元素,访问效率高。
有没有声明该接口有什么关系呢?主要用于一些通用的算法代码中,它可以根据这个声明而选择
效率更高的实现。
4.ArrayList的其他方法
构造方法:
public ArrayList(intinitialCapacity) //会初始化内部数组的大小,在知道元素长度的情况下,该构造方法可以避免重新分配和复制数组。public ArrayList(Collection extends E> c) //复制一份数据到当前ArrayList中去
两个返回数组的方法:
publicObject[] toArray()public T[] toArray(T[] a) //如果参数数组的长度足够,是复制数据到该数组,并返回值,不够就新建一个数组
另外需要注意Arrays中有一个静态方法asList可以将数组转换为List,例如:
Integer[] a = {1,2,3};
List list = Arrays.asList(a);
该方法返回的List并不是ArrayList,而是Arrays的一个内部类,在这个内部类实现中,
内部用的数组就是传入的数组,没有拷贝,也不会动态改变大小,所以对数组的修改也会
反应到List中,对List调用add,remove方法会抛出异常。
要用ArrayList的完整方法应该:
List list = new ArrayList(Arrays.asList(a));
ArrayList还提供了两个方法,可以控制内部使用的数组的大小:
//确保数组的大小至少为minCapacity,如果预知数组较大,可以调用它以减少内存分配次数
public void ensureCapacity(intminCapacity)//该方法会重新分配一个数组,大小刚好为实际内容的长度//调用该方法可以节省数组占用的空间
public void trimToSize()
5.ArrayList特点分析
作为程序员,就是要理解每种数据结构的特点,根据场合的不同,选择不同的数据结构。
对于ArrayList它的内部是采用动态数组实现的,这就决定了:
1)可以随机访问,按照索引位置进行访问的效率很高,为O(1)
2)除非数组已经排序,否则按照内容查找的效率很低O(N)
3)append元素的效率还行,重新分配和复制数组的开销被平摊了,添加N个元素的效率为O(N)
4)插入和删除元素的效率低,因为要移动元素,效率为O(N)
5)不是线程安全的
二)LinkedList
1.用法
publicLinkedList()public LinkedList(Collection extends E> c)
除了实现List接口外,LinkedList还实现了队列接口Queue(先进先出,从头部删除元素,尾部添加元素)。
public interface Queue extends Collection{boolean add(E e); //在尾部添加元素,队列满时抛出异常
boolean offer(E e); //在尾部添加元素,队列满时返回false
E remove(); //返回头部元素,并从队列中删除,队列为空时抛出异常
E poll(); //返回头部元素,并从队列中删除,队列为空时返回null
E element(); //返回头部元素,但不改变队列,队列为空时抛出异常
E peek(); //返回头部元素,但不改变队列,队列为空时返回null
}
其实LinkedList实现的是双端队列接口Dueue(双端队列可以当作栈使用,先进后出),
Dueue接口继承自队列接口Queue。Dueue的主要方法:
void push(E e);//入栈,即头部添加元素,栈满抛出异常
E pop();//出栈,返回头部元素,并从栈中删除,栈空抛异常
E peek();//查看栈头部元素,不修改栈,如果栈为空,返回null
所以双端队列即是队列,也是栈。栈只操作头部,队列两端都操作,但尾部
只添加,头部只查看和删除。此外双端队列还包括如下方法:
voidaddFirst(E e);voidaddLast(E e);
E getFirst();
E getLast();booleanofferFirst(E e);booleanofferLast(E e);
E peekFirst();
E peekLast();
E pollFirst();
E pollLast();
E removeFirst();
E removeLast();
双端队列还有一个迭代器方法:
Iterator descendingIterator();
2.实现原理
1)内部组成
它的内部实现是双向链表,每个元素都是单独存放的,
元素之间通过链链接在一起。为了表示链接关系需要
有一个节点的概念:
private static class Node{
E item;
Nodenext;
Nodeprev;
Node(Node prev, E element, Nodenext) {this.item =element;this.next =next;this.prev =prev;
}
}
LinkedList的内部组成就是如下三个实例变量:
transient int size = 0; //链表长度
transient Node first; //表示头节点
transient Node last;//表示尾节点
LinkedList的所有public方法内部都是操作的这三个变量。
2)add方法
add方法代码:
public booleanadd (E e) {
linkLast(e);return true;
}
linkLast方法:
voidlinkLast(E e) {final Node l =last;final Node newNode = new Node<>(l, e, null);
last=newNode;if (l == null)
first=newNode;elsel.next=newNode;
size++;
modCount++;
}
由此可以看出,于ArrayList不同LinkedList的内存是按需分配的,
不需要预先分配多余的内存,添加元素只需要分配新元素的空间,然后调节链接就可以了。
3)根据索引访问元素的get方法
public E get(intindex) {
checkElementIndex(index);returnnode(index).item;
}
//该方法检查索引的有效性
private void checkElementIndex(intindex) {if (!isElementIndex(index))throw newIndexOutOfBoundsException(outOfBoundsMsg(index));
}
private boolean isElementIndex(intindex) {return index >= 0 && index
}
Node node(intindex) {if (index < (size >> 1)) {
Node x =first;for (int i = 0; i < index; i++)
x=x.next;returnx;
}else{
Node x =last;for (int i = size - 1; i > index; i--)
x=x.prev;returnx;
}
}
由node方法可以看出,与ArrayList不同用索引获取元素效率很低。
4)根据内容查找
public intindexOf(Object o) {int index = 0;if (o == null) {for (Node x = first; x != null; x =x.next) {if (x.item == null)returnindex;
index++;
}
}else{for (Node x = first; x != null; x =x.next) {if(o.equals(x.item))returnindex;
index++;
}
}return -1;
}
效率同样也不高。
5)从中间插入元素
使用方法:
public void add(intindex, E element) {
checkPositionIndex(index);if (index ==size)
linkLast(element);elselinkBefore(element, node(index));
}
void linkBefore(E e, Nodesucc) {//assert succ != null;
final Node pred =succ.prev;final Node newNode = new Node<>(pred, e, succ);
succ.prev=newNode;if (pred == null)
first=newNode;elsepred.next=newNode;
size++;
modCount++;
}
可以看出,在中间插入元素,LinkedList需要按需分配内存,修改前驱和后继节点的链接,
虽然效率不高,但ArrayList可能需要分配额外的内存空间,且移动所有元素,相比效率更低。
6)删除元素
public E remove(intindex) {
checkElementIndex(index);returnunlink(node(index));
}
其他略。应该比ArrayList效率高。
3.LinkedList特点总结
1)按需分配,不需要预先分配很多空间
2)不可以随机访问(必须从头或尾顺着链接找),按索引访问效率低。O(N/2)
3)不管队列是否排列,只要是按内容查找,效率都比较低,必须逐个比较。O(N)
4)在两端添加,删除效率很高,为O(1)。
5)在中间插入、删除,要先定位,效率比较低,为O(N),但修改本身效率很高,为O(1)。
三)ArrayDeque
Java容器类中还有一个双端队列的实现类ArrayDeque,它是基于数组实现的。
该容器类主要解决了插入和删除元素效率低的问题。构造方法:
publicArrayDeque()public ArrayDeque(int numElements) //numElement初始分配的最小元素个数
public ArrayDeque(Collection extends E> c)
主要实例变量:
private transientE[] elements;private transient inthead;private transient int tail;
ArrayDeque的高效来源于head和tail这两个变量,这三个变量构建了循环数组。
1.循环数组
所谓循环数组,是指元素到数组尾后可以接着从数组头开始,
数组的长度、第一个和最后一个元素都与head和tail这两变量相关,具体说:
1)如果head和tail相同,则数组为空,长度为0;
2)如果tail大于head,则第一个元素为elements[head],最后一个元素为elements[tail-1]
长度为tail-head,元素索引为head,到tail-1;
3)如果tail小于head,且为0,则第一个元素为elements[head],
最后一个为elements[elements.length-1],元素索引从head到elements.length-1;
4)如果tail小于head,且大于0,则会形成循环,第一个元素为elements[head],
最后一个元素为elements[tail-1],元素索引从head到elements.length-1,然后从0到tail-1。
2.构造方法
默认构造方法:
publicArrayDeque() {
elements= new Object[16];
}
有参数的:
public ArrayDeque(intnumElements) {
allocateElements(numElements);
}
allocateElements 作用:计算应该分配的数组长度。
最后一个构造函数:
public ArrayDeque(Collection extends E>c) {
allocateElements(c.size());
addAll(c);
}
各种方法实现细节略
3.ArrayDeque特定总结
1)在两端添加、删除元素的效率很高,添加N个效率为O(N);
2)根据元素内容查找和删除的效率比较低为O(N)
3)没有索引的概念,不能进行索引操作。
总之和LinkedList比较,如果只需要使用Deque接口的方法ArrayDeque效率更高。
如果需要经常在中间进行插入和删除或者要使用索引LinkedList更好。
另外,本节介绍的三种容器类型,按内容查找的效率都很低。