集合是编程中使用最广泛的类之一,理论上来说是可以无限变大的容器,但是容器变得非常大的时候,初始容量就会非常重要,以下为原因。
ArrayList的扩容机制是比较消耗资源的,首先先看ArrayList的扩容机制源码:
public boolean add(E e) {
ensureCapacity(size + 1);
elementData[size++] = e;
return true;
}
public void ensureCapacity(int minCapacity) {
modCount++; //修改计数器
int oldCapacity = elementData.length;
//当前需要的长度超过了数组长度,进行扩容处理
if (minCapacity > oldCapacity) {
Object oldData[] = elementData;
//新的容量 = 旧容量 * 1.5 + 1
int newCapacity = (oldCapacity * 3)/2 + 1;
if (newCapacity < minCapacity)
newCapacity = minCapacity;
//数组拷贝,生成新的数组
elementData = Arrays.copyOf(elementData, newCapacity);
}
}
可以看到,ArrayList每次新增一个元素时,都会先检查ArrayList的当前容量是否已经到达临界点,如果到达了临界点则会扩容1.5倍。注意:ArrayList的扩容以及数组的拷贝生成新的数组是相当耗资源的。
若我们已知集合的使用场景,知道集合的大体范围,最好是指定初始化容量,这样对资源的利用会更好,尤其是大数据量的前提下,效率的提升和资源的利用明显会更加具有优势。