了解ArrayList的实现,基于1.7
一、扩容
ArrayList实际是用数组来存储数据,但是数组在定义时必须指定长度,长度有限,存储的元素个数不定。当超过默认的容量时,ArrayList就需要扩容。
ArrayList定义的字段:
/**
* 默认容量
*/
private static final int DEFAULT_CAPACITY = 10;
/**
* 空数组
*/
private static final Object[] EMPTY_ELEMENTDATA = {};
/**
* The array buffer into which the elements of the ArrayList are stored.
* The capacity of the ArrayList is the length of this array buffer. Any
* empty ArrayList with elementData == EMPTY_ELEMENTDATA will be expanded to
* DEFAULT_CAPACITY when the first element is added.
* 存储的元素由这个数组来保存。任何空ArrayList,即elementData == EMPTY_ELEMENTDATA时,
* 当第一次加入元素,ArrayList会被扩容至默认容量10
*
*/
private transient Object[] elementData;
/**
* 存储的元素个数,等于elementData.length
* @serial
*/
private int size;
//最大容量
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
对ArrayList的字段了解后,我们来看它的add方法,该方法在存储元素之前必须要检查是否需要扩容,如果需要则扩容。查看add方法的实现。
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
private void ensureCapacityInternal(int minCapacity) {
//如果当前为空数组,没有存储任何元素
if (elementData == EMPTY_ELEMENTDATA) {
//求出需要扩容后的实际大小,取默认容量和传入容量的最小值
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
}
ensureExplicitCapacity(minCapacity);
}
private void ensureExplicitCapacity(int minCapacity) {
//修改次数,迭代时每次获取最新的修改次数,
//如果与迭代前的修改次数不同则抛出异常,保证迭代的数据正确性,具体要看迭代部分的代码
modCount++;
// overflow-conscious code
//添加元素后的容量与未添加的容量相减,判断是否需要扩容
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
根据上面的代码,可以知道真正扩容的是这个方法grow,查看这个方法的实现
private void grow(int minCapacity) {
// overflow-conscious code
//原来的容量大小
int oldCapacity = elementData.length;
//新的容量大小。位运算,右移一位相当于 oldCapacity/2,但效率更快,比1.6的写法更优。扩容为1.5倍
int newCapacity = oldCapacity + (oldCapacity >> 1);
//扩容后的容量大小还是不够用,置为传入的容量
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
//超过最大容量
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
//容量小于0,抛出异常
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
//超过最大容量,置为Integer的最大值,否则为ArrayList初始定义的最大容量
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
从上面代码知道,扩容后的容量是 oldCapacity + (oldCapacity >> 1); ,变为原来的1.5倍,1.6的写法是 int newCapacity = (oldCapacity * 3)/2 + 1; 。计算机里执行乘法实际是把乘数的二进制每一位与被乘数相乘,把所有结果再相加,这个过程非常复杂。经过改进后,运用位运算,执行的操作会少很多,相应的速度就快了。
二、不用的对象置null,提高性能
先来看一下这段代码
private void fastRemove(int index) {
modCount++;
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
}
remove方法在删除元素时,实际调用的上面的方法。原理是把要删除的元素后的数据全体向前移一位,令最后一位置null。其中的elementData[--size] = null,这样有利于回收内存,并不会直接引发gc,但在下一次gc开始后会把这些不可达的对象回收。之所以说不可达,是因为引用计数是不可靠的,例如有两个对象已经被置为null,但是这两个对象内部有相互引用的属性,实际上系统已经不用用到这两个对象。如果是直接把size减一,之前删除的元素还实际存在,gc并不会回收,浪费内存。我们在写代码的时候,顺手把不同的对象赋为null,是一个不错的编程习惯。
三、性能考虑
ArrayList需要扩容,这是一个很耗性能的操作。我们在实际使用的时候,如果知道数据量比较大,最好在创建之时给予一个初始值。在数组长度已经很大的情况下扩容,耗的性能巨大。当然数组长度小的时候扩容,所损耗的性能可以忽略不计。
如果一个长度很大的ArrayList删除了很多元素之后,可以执行这个方法trimToSize,它会缩短数组的长度,与扩容相反。提高内存利用率。