简介
Vector与ArrayList是十分相似的两个类,阅读两者的代码发现从底层数据结构到操作逻辑上都基本相似,由于这个结构比较简单,这篇博客重点关注三个问题:线程安全,modCount,自动扩容。
基础与线程安全
- 两者的底层都是依靠数组存储数据(如下图,左Vector,右ArrayList), ArrayList中使用transient的关键字表明elemenData不直接参与序列化,ArrayList序列化时会调用另一个方法使得只写入有效元素(要知道容量一般会大于实际的元素个数)。
- 既然是数组,那么set,get方法的复杂度都是相似的。
- Vector是线程安全的,在于其所有的方法都是同步方法(synchronized)
自动扩容
- 从上面可以看到,由于Vector和ArrayList底层都是数组,为了保证容量足够,需要考虑自动扩容,扩容的核心是grow方法,一般是会增加0.5倍的容量。
modCount
- 两个类中都会出现
modCount++;
这个语句,modCount表示的是整个结构改变,结构改变是指数组大小发生改变,或者会使迭代器出现错误的操作。 - modCount主要被迭代器使用,用于提供迭代器“错乱”时快速失败,以ArrayList提供的迭代器为例,先展示一个错误的迭代删除的做法
// list是一个ArrayList<String>类型, 现在希望删除index为2的元素
Iterator itr = list.iterator();
int i=0;
while (itr.hasNext()) {
if (i == 2) {
list.remove(itr.next());
}
}
这种情况下会出现 ConcurrentModificationException
异常,分析ArrayList的迭代器
即一开始两个变量是下图表示的位置,next()方法具体做的是1. 将cursor推向下一个元素 2. 令lastRet指向下一个元素,并返回该元素
当i变为2时,应该是这样的指向
如果这时候调用list的remove()方法,本来想达到的效果是lastRet指向D这个元素,而Cursor指向E,然而实际上做到的只是下面的操作,即调用next方法获取待删除元素的同时,也会将指针向前推,这时候就会出现指针错位的问题。
为了解决这个问题,JDK中引入了modCount这个变量,每当结构发生改变时,都会modCount++,在调用next和remove方法时,都会先检查modCount是否跟原来的modCount(expectedModCount)相同,如果不相同,则抛出异常,快速失败。
那么正确的写法应该是怎样的呢?我们看迭代器的remove()方法,可以发现,为了让cursor正确指向删除后的下一个元素,cursor直接变成自己的前一个,即lastRet,这样即使数组中因为删除而使得后面的元素都向前推进一个位置,cursor仍是指向被删除元素的下一个元素。
因此,正确的写法应该是
Iterator itr = list.iterator();
int i=0;
while (itr.hasNext()) {
if (i == 2) {
itr.remove();
}
}
总结
- Vector和ArrayList是都是基于数组实现的队列,前者线程安全,后者不是
- 遍历删除时,应该用迭代器遍历,且用remove方法删除指定元素