集合面试题
线程安全
我们说集合都是非线程安全的,这里说的非线程安全指的是集合类作为共享变量,被多线程读写的时候,才会线程不安全。如果要实现线程安全的集合,JDK 推荐我们使用 Collections.synchronized*
类,Collections 帮我们实现了 List、Set、Map 对应的线程安全的方法:
图中实现了各种集合类型的线程安全的方法,我们以 SynchronizedList 为例,从源码上来看下,Collections 是如何实现线程安全的:
static class SynchronizedList<E>
extends SynchronizedCollection<E>
implements List<E> {
// 这个 List 就是我们需要保证线程安全的类
final List<E> list;
SynchronizedList(List<E> list) {
super(list);
this.list = list;
}
SynchronizedList(List<E> list, Object mutex) {
super(list, mutex);
this.list = list;
}
// 我们可以看到,List 的所有操作都使用了 synchronized 关键字,来进行加锁
// synchronized 是一种悲观锁,能够保证同一时刻,只能有一个线程能够获得锁
public E get(int index) {
synchronized (mutex) {return list.get(index);}
}
public E set(int index, E element) {
synchronized (mutex) {return list.set(index, element);}
}
public void add(int index, E element) {
synchronized (mutex) {list.add(index, element);}
}
public E remove(int index) {
synchronized (mutex) {return list.remove(index);}
}
}
从源码中我们可以看到 Collections 是通过 synchronized
关键字给 List 操作数组的方法加上锁,来实现线程安全的。
集合性能
集合的单个操作,一般都没有性能问题,性能问题主要出现的批量操作上。
批量新增
在 List 和 Map 大量数据新增的时候,我们不要使用 for 循环 + add/put 方法新增,这样子会有很大的扩容成本,我们应该尽量使用 addAll 和 putAll 方法进行新增。
主要原因在于批量新增,只会扩容一次
,大大缩短了运行时间,而单个新增,每次到达扩容阀值时,都会进行扩容
,在整个过程中就会不断的扩容,浪费了很多时间
public boolean addAll(Collection<? extends E> c) {
Object[] a = c.toArray();
int numNew = a.length;
// 确保容量充足,整个过程只会扩容一次
ensureCapacityInternal(size + numNew);
// 进行数组的拷贝
System.arraycopy(a, 0, elementData, size, numNew);
size += numNew;
return numNew != 0;
}
以上是 ArrayList 批量新增的演示,我们可以看到,整个批量新增的过程中,只扩容了一次,HashMap 的 putAll 方法也是如此,整个新增过程只会扩容一次,大大缩短了批量新增的时间,提高了性能。
批量删除
批量删除 ArrayList 提供了 removeAll 的方法,HashMap 没有提供批量删除的方法,我们一起来看下 removeAll 的源码实现,是如何提高性能的:
public boolean removeAll(Collection<?> c) {
Objects.requireNonNull(c);
return batchRemove(c, false);
}
private boolean batchRemove(Collection<?> c, boolean complement) {
final Object[] elementData = this.elementData;
// r表示当前循环的位置、
// w位置之前都是不需要被删除的数据,w位置之后都是需要被删除的数据
int r = 0, w = 0;
boolean modified = false;
try {
for (; r < size; r++)
if (c.contains(elementData[r]) == complement)
elementData[w++] = elementData[r];
} finally {
// Preserve behavioral compatibility with AbstractCollection,
// even if c.contains() throws.
if (r != size) {
System.arraycopy(elementData, r,
elementData, w,
size - r);
w += size - r;
}
if (w != size) {
// clear to let GC do its work
for (int i = w; i < size; i++)
elementData[i] = null;
modCount += size - w;
size = w;
modified = true;
}
}
return modified;
}
我们看到 ArrayList 在批量删除时,如果程序执行正常,只有一次 for 循环,如果程序执行异常,才会加一次拷贝,而单个 remove 方法,每次执行的时候都会进行数组的拷贝(当删除的元素正好是数组最后一个元素时除外),当数组越大,需要删除的数据越多时,批量删除的性能会越差,所以在 ArrayList 批量删除时,强烈建议使用 removeAll 方法进行删除。