ArrayList是面试中常见的Java容器,也算是Java中比较简单的容器,我们今天就来讲讲ArrayList的源码和常见的面试点。
概述
ArrayList是一种底层基于数组实现的容器,并且能够实现随元素数量增加而进行动态扩容。与LinkedList相比,ArayList非常适合于查找元素,原因在于ArrayList底层实现原理是数组存储的内存在物理上是连续的,但增加和删除元素时,ArrayList比起LinkedList就比较慢了。此外,ArrayList时线程不安全的容器,要使用线程安全的集合容器,可以使用Vector。Vector实现线程安全的方式非常简单,直接在方法上加上了synchronized同步锁。ArrayList也可以通过Collections.synchronizedList
将ArrayList包装一层同步锁实现线程安全,原理同Vector。
ArrayList初始化分析
鉴于源码内容较长,我们在这里先对ArrayList的几种构造方法进行解读,以下是JDK8中与构造方法相关的部分源码。
public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable {
private static final Object[] EMPTY_ELEMENTDATA = {};
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
transient Object[] elementData;
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}
public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}
}
观察一下上面的代码,首先是无参构造方法。我们看到,在该方法中,elementData
被赋予了一个空数组,而这里是JDK6和之后的JDK之间一个比较大的区别。下面是JDK6的构造方法源码,我们可以发现在JDK6中的无参构造方法直接调用this(10)
给数组容量初始化为10,而在那之后的版本中都是默认初始化为空数组。
public ArrayList(int initialCapacity) {
super();
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
this.elementData = new Object[initialCapacity];
}
public ArrayList() {
this(10);
}
对于有参构造函数ArrayList(int initialCapacity)
,只要初始化容量initialCapacity
的值合适,就可以初始化适当大小的数组。
对于有参构造函数ArrayList(Collection<? extends E> c)
,先将传入的集合转化为数组,然后将数组长度赋值给size
,如果长度为0,则将数组初始化为空数组,否则判断数组类型是否是Object[]
,如果不是就复制elementData
中的元素转成Object[]
数组给elementData
。
ArrayList添加元素
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
我们来看一下默认的add(E e)
添加元素的方法,我们看到在执行该方法时,会先调用ensureCapacityInternal(size + 1)
检查添加一个元素之后是否需要扩容,然后将传入的元素添加到数组中,并增加数组的大小,最后返回true。接下来,我们要看看ensureCapacityInternal(int minCapacity)
方法的具体源码。
private void ensureCapacityInternal(int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
}
ensureExplicitCapacity(minCapacity);
}
通过观察ensureCapacityInternal(int minCapacity)
函数我们可以看到,ArrayList会首先判断elementData
是不是默认的空数组,如果是的话,会比较DEFAULT_CAPACITY
也就是10和minCapacity
的大小,取较大的值赋给minCapacity
。联系这里的源码我们可以知道,当一个ArrayList在无参构造方法不会初始化数组容量,只有在添加元素时,才会初始化数组容量,这里证实了我们前面说的和JDK6的不同之处。
接着往下看,我们看到这个方法又调用了ensureExplicitCapacity(int minCapacity)
方法,我们继续往下看这个方法的源码。
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
在ensureExplicitCapacity(int minCapacity)
中首先我们需要知道modCount
的作用,它是ArrayList的父类AbstractList中的一个成员变量,是用来记录修改次数的,因为增加元素是修改操作,所以modCount++
。接着代码判断minCapacity
的值有没有超过数组的容量,如果超过了就调用grow(int minCapacity)
进行扩容,继续看后面的源码…看到这里,相信小伙伴们快看吐了,说实话,我写到这儿都快写吐了,这一层又一层的调用,真是老千层饼了…
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
在上面的grow(int minCapacity)
中,oldCapacity
是原来数组的容量,newCapacity
是oldCapacity
的1.5倍,这里用到了位运算,不了解的同学可以先去学习一下位运算相关的知识。顺便提一下,在JDK6中,计算新容量大小的方法是int newCapacity = (oldCapacity * 3)/2 + 1
。接着看源码,后面是对newCapacity
范围做校验,如果比minCapacity
小,则将minCapacity
赋值给minCapacity
,如果比MAX_ARRAY_SIZE
大,就为数组赋一个超大容量。最后将数组元素复制到新的elementData
中,也赋予新的容量newCapacity
。
看完了默认的元素添加方法,我们再看一下在指定位置添加元素的方法。
public void add(int index, E element) {
rangeCheckForAdd(index);
ensureCapacityInternal(size + 1); // Increments modCount!!
System.arraycopy(elementData, index, elementData, index + 1,
size - index);
elementData[index] = element;
size++;
}
private void rangeCheckForAdd(int index) {
if (index > size || index < 0)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
其实和前面的默认添加元素方法没有太大区别,就是添加了一个下标校验防止越界。另外,还有将数组的index
下标之后的元素拷贝到都向后移一位的操作,我们用图片解释一下这个操作。下图中,在下标为2的地方插入一个元素,那么从下标2开始的每一个元素都会向后移动,为插入的元素腾出一个位置。这也就解释了为什么ArrayList效率低的原因,这要是几亿、几十亿个数据都向后移动一位,那得多久啊…
ArrayList删除元素
public E remove(int index) {
rangeCheck(index);
modCount++;
E oldValue = elementData(index);
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
return oldValue;
}
private void rangeCheck(int index) {
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
@SuppressWarnings("unchecked")
E elementData(int index) {
return (E) elementData[index];
}
看完了前面添加元素的操作,删除操作就容易多了,首先是对下标值的范围校验,然后又是对数组的复制操作arraycopy
。继续画个图方便大家理解。所以同理,删除操作效率也很低。