4. 集合的线程安全
4.1 ArrayList线程安全
ArrayList是否是线程安全的?都知道它是线程不安全的。那么它为什么是线程不安全的呢?它线程不安全的具体体现又是怎样的呢?我们从源码的角度来看下。
ArrayList的add方法源码部分属性字段
public class ArrayList<E> extends AbstractList<E>
implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
/**
* 列表元素集合数组
* 如果新建ArrayList对象时没有指定大小,那么会将EMPTY_ELEMENTDATA赋值 * elementData,并在第一次添加元素时,将列表容量设置为DEFUALT_CAPACITY
*
*/
transient Object[] elementData;
/**
* 列表大小,elementData中存储的元素个数
*/
private int size;
}
所以通过这两个字段我们可以看出,ArrayList的实现主要就是用了一个Object的数组,用来保存所有的元素,以及一个size变量用来保存当前数组中已经添加多少元素。
问题一:ArrayIndexOutOfBoundsException
接着我们看下最重要的add操作时的源码
public boolean add(E e) {
/**
* 添加一个元素时,做了如两部操作
* 1.判断列表的capacity容量是否足够,是否需要扩容
* 2.真正将元素放在列表的元素数组里面
*/
ensureCapacityInternal(size + 1);
elementData[size++] = e;
return true;
}
ensureCapacityInternal() 这个方法的作用是判断如果将当前的新元素加到列表后面,列表的elementData数组大小是否满足,如果size+1的这个需求长度大于了elementData这个数组的长度,那么就要对这个数组进行扩容。
由此看到add元素时,实际做了两个大的步骤:
- 判断elementData数组容量是否满足需求;
- 在elementData对应位置上设置值;
这样也就出现第一个导致线程不安全的隐患,在多个线程进行add操作时可能会导致elementData数组越界。具体逻辑如下:
- 列表下标为最大为9(下标从0开始算),即最大容量为10个,同时当前数组有数据的元素为9个(size=9),还可以容纳1个元素。
- 线程A开始进入add方法,这时它获取到size的值为9,调用ensureCapacityInternal方法进行容量判断。
- 线程B此时也进入add方法,它获取到size的值也为9,也开始调用ensureCapacityInternal方法。
- 线程A发现需求容量个数为10,而elementData的容量就为10,可以容纳。于是它不在扩容,返回。
- 线程B也发现需要容量个数为10,也可以容纳,返回。
- 线程A开始进行设置值操作,elementData[size++] = e操作。此时size变为10;
- 线程B也开始进行设置值操作,他尝试设置elementData[10]=e;而elementData没有进行扩容,它的下标最大为9。于是此时会报出一个数组越界的异常ArrayIndexOutOfBoundsException。
问题二:空值问题
在add方法的第二步**elementData[size++] = e;**设置值的操作同样会导致线程不安全。从这可以看出,这不操作也不是一个原子操作,它有如下两步操作构成:
- elementData[size] =e;
- size=size+1;
在单线程执行这两条代码时没有任何问题,但是当多线程环境下执行时,可能就会发生一个线程值覆盖另一个线程添加的值,具体逻辑如下:
- 列表大小为0,即size=0;
- 线程A开始添加一个元素,值为A。此时它执行第一条操作,将A放在了elementData下标为0的位置上。
- 线程A开始将size的值增加为1;
- 线程B开始将size的值增加为2;
这样线程AB执行完毕后,理想情况为size为2,elementData下标为0的位置为A,下标1的位置为B。
而实际情况变成size为2,elementData下标为0的位置变成B,下标1的位置上什么都没有。并且后续除非使用set方法修改此位置的值,否则将一直为null,因为size为2,添加元素时会从下标为2的位置上开始。
最后的输出结果,有如下的部分:
第12个元素为:1006
第13个元素为:6
第14个元素为:1007
第15个元素为:7
第16个元素为:null
第17个元素为:8
第18个元素为:9
可以看到第16个元素的值为null,这也就是我们上面所说的情况。
4.2 Vector
Vector 是矢量队列,它是JDK1.0版本添加的类。继承AbstractList实现了List,RandomAccess,Cloneable这些接口。继承了AbstractList,实现了List;所以它
是一个队列,支持相关的添加、删除、修改、遍历等功能。Vector实现了RandmoAccess接口,即提供了随机访问功能。
RandomAcess是Java中用来使用List,为List提供快速访问功能的。在Vector中,我们既可以通过元素的序号快速获取元素对象;这就是快速随机访问。Vector实现了Cloneable接口,即实现clone() 函数。它能被克隆。
和ArrayList不同,Verctor中操作是线程安全的。
public static void main(String[] args) {
// Vector 解决
List<String> list = new Vector<>();
for (int i = 0; i < 30; i++) {
new Thread(() -> {
// 向集合添加内容,ConcurrentModificationException
list.add(UUID.randomUUID().toString().substring(0, 8));
// 从集合获取内容
System.out.println(list);
}, String.valueOf(i)).start();
}
}
现在没有运行出现并发异常,为什么?
查看Vector的add方法
/**
* Appends the specified element to the end of this Vector.
*
* @param e element to be appended to this Vector
* @return {@code true} (as specified by {@link Collection#add})
* @since 1.2
*/
public synchronized boolean add(E e) {
modCount++;
ensureCapacityHelper(elementCount + 1);
elementData[elementCount++] = e;
return true;
}
add方法synchronized关键字修辞,线程安全,因此没有线程安全问题
4.3 Collections
Collections提供方法synchronizedList保证list是同步线程安全的
public static void main(String[] args) {
// Collections 解决
List<String> list = Collections.synchronizedList(new ArrayList<>());
for (int i = 0; i < 30; i++) {
new Thread(() -> {
// 向集合添加内容,ConcurrentModificationException
list.add(UUID.randomUUID().toString().substring(0, 8));
// 从集合获取内容
System.out.println(list);
}, String.valueOf(i)).start();
}
}
没有并发修改异常
查看方法源码
/**
* Returns a synchronized (thread-safe) list backed by the specified
* list. In order to guarantee serial access, it is critical that
* <strong>all</strong> access to the backing list is accomplished
* through the returned list.<p>
*
* It is imperative that the user manually synchronize on the returned
* list when iterating over it:
* <pre>
* List list = Collections.synchronizedList(new ArrayList());
* ...
* synchronized (list) {
* Iterator i = list.iterator(); // Must be in synchronized block
* while (i.hasNext())
* foo(i.next());
* }
* </pre>
* Failure to follow this advice may result in non-deterministic behavior.
*
* <p>The returned list will be serializable if the specified list is
* serializable.
*
* @param <T> the class of the objects in the list
* @param list the list to be "wrapped" in a synchronized list.
* @return a synchronized view of the specified list.
*/
public static <T> List<T> synchronizedList(List<T> list) {
return (list instanceof RandomAccess ?
new SynchronizedRandomAccessList<>(list) :
new SynchronizedList<>(list));
}
4.4 CopyOnWriteArrayList
首先我们对CopyOnWritreArrayList进行学习,其特点如下:
它相当于线程安全的ArrayList。和ArrayList一样,它是个可变数组;但是和ArrayList不同的是,他具有以下特性。
-
它最适合具有以下特征的应用程序:List大小通常保持很小,只读操作远多于可变操作,需要在遍历期间防止线程间的冲突。
-
它是线程安全的。
-
因为通常需要复制整个基础数组,所以可变操作(add()、set()和remove()等等)的开销很大。
-
迭代器支持,hasNext()、next()等不可变操作,但不支持可变remove()等操作。
-
使用迭代器进行遍历的速度很快,并且不会与其他线程发生冲突。在构造迭代器时,迭代依赖不变的数组快照。
4.4.1 CopyOnWriteArrayList分析
-
独占锁效率低:采用读写分离思想解决
-
写线程获取到锁,其他线程阻塞
-
复制思想:
当我们往容器添加元素的时候,不直接往容器添加,而是先将当前容器进行copy,复制出新的一个容器,然后往新的容器添加元素,添加完元素之后,再将原容器的引用指向新的容器。
这时候会抛出一个新的问题,也就是数据不一致的问题。如果写线程还没来得及写入内存,其他线程就会读到脏数据。
public static void main(String[] args) { List<String> list = new CopyOnWriteArrayList<>(); for (int i = 0; i < 30; i++) { new Thread(() -> { // 向集合添加内容,ConcurrentModificationException list.add(UUID.randomUUID().toString().substring(0, 8)); // 从集合获取内容 System.out.println(list); }, String.valueOf(i)).start(); } }
没有线程安全问题。
4.4.2 原因分析
-
动态数组机制
1.1 它内部有一个"volatile数组"(array)来保持数据。在"添加/修改/删除"数据时,都会新建一个数组,并将更新后的数据拷贝到新建的数组中,最后再将该数组赋值给"volatile数组",这就是它叫做CopyOnWriteArrayList的原因
1.2 由于它在"添加/修改/删除"数据时,都会新建数组,所涉及到修改数据的操作,CopyOnWriteArrayList 效率很低;但是只有遍历查询的话效率会比较高。
-
"线程安全"机制
2.1 通过 valitile和互斥锁来实现
2.2 通过 valitile数组来保存数据。一个线程读取volatile数组时,总能看到其它线程对该volatile变量最后的写入;就这样,通过volatile提供了"读取到的数据总是最新的" 这个机制的保证。
2.3 通过互斥锁来保护数据。在"添加/修改/删除"数据时,会先"获取互斥锁"再修改完毕之后,先将数据更新到"volatile数组"中,然后再“释放互斥锁”,就达到保护数据的目的。
4.5 小结
4.5.1 线程安全与线程不安全集合
集合类型中存在线程安全与线程不安全的两种,常见例如:
ArrayList ---- Vector
HashMap ---- HashTable
但是以上都是通过synchronized关键字实现,效率极低。
4.5.2 Collections构建的线程安全集合
4.5.3 CopyOnWriteArrayList
CopyOnWriteArrayList、CopyOnWriteArraySet 类型,通过动态数组与线程安全个方面保证线程安全。
-
-