4. 集合的线程安全

7 篇文章 0 订阅

4. 集合的线程安全

4.1 ArrayList线程安全

​ ArrayList是否是线程安全的?都知道它是线程不安全的。那么它为什么是线程不安全的呢?它线程不安全的具体体现又是怎样的呢?我们从源码的角度来看下。

ArrayList的add方法源码部分属性字段

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
  /**
   * 列表元素集合数组
   * 如果新建ArrayList对象时没有指定大小,那么会将EMPTY_ELEMENTDATA赋值	  	 * elementData,并在第一次添加元素时,将列表容量设置为DEFUALT_CAPACITY
   *
   */
   transient Object[] elementData;

    /**
     * 列表大小,elementData中存储的元素个数
     */
    private int size;
}

 所以通过这两个字段我们可以看出,ArrayList的实现主要就是用了一个Object的数组,用来保存所有的元素,以及一个size变量用来保存当前数组中已经添加多少元素。

问题一:ArrayIndexOutOfBoundsException

接着我们看下最重要的add操作时的源码

  public boolean add(E e) {
       /**
      	* 添加一个元素时,做了如两部操作
      	* 1.判断列表的capacity容量是否足够,是否需要扩容
      	* 2.真正将元素放在列表的元素数组里面
      	*/
        ensureCapacityInternal(size + 1); 
        elementData[size++] = e;
        return true;
    }

 ensureCapacityInternal() 这个方法的作用是判断如果将当前的新元素加到列表后面,列表的elementData数组大小是否满足,如果size+1的这个需求长度大于了elementData这个数组的长度,那么就要对这个数组进行扩容。

由此看到add元素时,实际做了两个大的步骤:

  1. 判断elementData数组容量是否满足需求;
  2. 在elementData对应位置上设置值;

 这样也就出现第一个导致线程不安全的隐患,在多个线程进行add操作时可能会导致elementData数组越界。具体逻辑如下:

  1. 列表下标为最大为9(下标从0开始算),即最大容量为10个,同时当前数组有数据的元素为9个(size=9),还可以容纳1个元素。
  2. 线程A开始进入add方法,这时它获取到size的值为9,调用ensureCapacityInternal方法进行容量判断。
  3. 线程B此时也进入add方法,它获取到size的值也为9,也开始调用ensureCapacityInternal方法。
  4. 线程A发现需求容量个数为10,而elementData的容量就为10,可以容纳。于是它不在扩容,返回。
  5. 线程B也发现需要容量个数为10,也可以容纳,返回。
  6. 线程A开始进行设置值操作,elementData[size++] = e操作。此时size变为10;
  7. 线程B也开始进行设置值操作,他尝试设置elementData[10]=e;而elementData没有进行扩容,它的下标最大为9。于是此时会报出一个数组越界的异常ArrayIndexOutOfBoundsException。

问题二:空值问题

​ 在add方法的第二步**elementData[size++] = e;**设置值的操作同样会导致线程不安全。从这可以看出,这不操作也不是一个原子操作,它有如下两步操作构成:

  1. elementData[size] =e;
  2. size=size+1;

 在单线程执行这两条代码时没有任何问题,但是当多线程环境下执行时,可能就会发生一个线程值覆盖另一个线程添加的值,具体逻辑如下:

  1. 列表大小为0,即size=0;
  2. 线程A开始添加一个元素,值为A。此时它执行第一条操作,将A放在了elementData下标为0的位置上。
  3. 线程A开始将size的值增加为1;
  4. 线程B开始将size的值增加为2;

 这样线程AB执行完毕后,理想情况为size为2,elementData下标为0的位置为A,下标1的位置为B。

而实际情况变成size为2,elementData下标为0的位置变成B,下标1的位置上什么都没有。并且后续除非使用set方法修改此位置的值,否则将一直为null,因为size为2,添加元素时会从下标为2的位置上开始。

最后的输出结果,有如下的部分:

12个元素为:100613个元素为:614个元素为:100715个元素为:716个元素为:null17个元素为:818个元素为:9

可以看到第16个元素的值为null,这也就是我们上面所说的情况。

4.2 Vector

 Vector 是矢量队列,它是JDK1.0版本添加的类。继承AbstractList实现了List,RandomAccess,Cloneable这些接口。继承了AbstractList,实现了List;所以它

是一个队列,支持相关的添加、删除、修改、遍历等功能。Vector实现了RandmoAccess接口,即提供了随机访问功能

 RandomAcess是Java中用来使用List,为List提供快速访问功能的。在Vector中,我们既可以通过元素的序号快速获取元素对象;这就是快速随机访问。Vector实现了Cloneable接口,即实现clone() 函数。它能被克隆。

和ArrayList不同,Verctor中操作是线程安全的。

    public static void main(String[] args) {
        // Vector 解决
        List<String> list = new Vector<>();
        for (int i = 0; i < 30; i++) {
            new Thread(() -> {
                // 向集合添加内容,ConcurrentModificationException
                list.add(UUID.randomUUID().toString().substring(0, 8));
                // 从集合获取内容
                System.out.println(list);
            }, String.valueOf(i)).start();
        }
    }

现在没有运行出现并发异常,为什么?

查看Vector的add方法

    /**
     * Appends the specified element to the end of this Vector.
     *
     * @param e element to be appended to this Vector
     * @return {@code true} (as specified by {@link Collection#add})
     * @since 1.2
     */
    public synchronized boolean add(E e) {
        modCount++;
        ensureCapacityHelper(elementCount + 1);
        elementData[elementCount++] = e;
        return true;
    }

add方法synchronized关键字修辞,线程安全,因此没有线程安全问题

4.3 Collections

Collections提供方法synchronizedList保证list是同步线程安全的

    public static void main(String[] args) {
        //  Collections 解决
        List<String> list = Collections.synchronizedList(new ArrayList<>());
        for (int i = 0; i < 30; i++) {
            new Thread(() -> {
                // 向集合添加内容,ConcurrentModificationException
                list.add(UUID.randomUUID().toString().substring(0, 8));
                // 从集合获取内容
                System.out.println(list);
            }, String.valueOf(i)).start();
        }
    }

没有并发修改异常

查看方法源码

    /**
     * Returns a synchronized (thread-safe) list backed by the specified
     * list.  In order to guarantee serial access, it is critical that
     * <strong>all</strong> access to the backing list is accomplished
     * through the returned list.<p>
     *
     * It is imperative that the user manually synchronize on the returned
     * list when iterating over it:
     * <pre>
     *  List list = Collections.synchronizedList(new ArrayList());
     *      ...
     *  synchronized (list) {
     *      Iterator i = list.iterator(); // Must be in synchronized block
     *      while (i.hasNext())
     *          foo(i.next());
     *  }
     * </pre>
     * Failure to follow this advice may result in non-deterministic behavior.
     *
     * <p>The returned list will be serializable if the specified list is
     * serializable.
     *
     * @param  <T> the class of the objects in the list
     * @param  list the list to be "wrapped" in a synchronized list.
     * @return a synchronized view of the specified list.
     */
    public static <T> List<T> synchronizedList(List<T> list) {
        return (list instanceof RandomAccess ?
                new SynchronizedRandomAccessList<>(list) :
                new SynchronizedList<>(list));
    }

4.4 CopyOnWriteArrayList

 首先我们对CopyOnWritreArrayList进行学习,其特点如下:

 它相当于线程安全的ArrayList。和ArrayList一样,它是个可变数组;但是和ArrayList不同的是,他具有以下特性。

  1. 它最适合具有以下特征的应用程序:List大小通常保持很小,只读操作远多于可变操作,需要在遍历期间防止线程间的冲突。

  2. 它是线程安全的。

  3. 因为通常需要复制整个基础数组,所以可变操作(add()、set()和remove()等等)的开销很大。

  4. 迭代器支持,hasNext()、next()等不可变操作,但不支持可变remove()等操作。

  5. 使用迭代器进行遍历的速度很快,并且不会与其他线程发生冲突。在构造迭代器时,迭代依赖不变的数组快照。

    4.4.1 CopyOnWriteArrayList分析

    1. 独占锁效率低:采用读写分离思想解决

    2. 写线程获取到锁,其他线程阻塞

    3. 复制思想:

       当我们往容器添加元素的时候,不直接往容器添加,而是先将当前容器进行copy,复制出新的一个容器,然后往新的容器添加元素,添加完元素之后,再将原容器的引用指向新的容器。

        这时候会抛出一个新的问题,也就是数据不一致的问题。如果写线程还没来得及写入内存,其他线程就会读到脏数据。

          public static void main(String[] args) {
              List<String> list = new CopyOnWriteArrayList<>();
              for (int i = 0; i < 30; i++) {
                  new Thread(() -> {
                      // 向集合添加内容,ConcurrentModificationException
                      list.add(UUID.randomUUID().toString().substring(0, 8));
                      // 从集合获取内容
                      System.out.println(list);
                  }, String.valueOf(i)).start();
              }
          }
      

      没有线程安全问题。

      4.4.2 原因分析

      1. 动态数组机制

        1.1  它内部有一个"volatile数组"(array)来保持数据。在"添加/修改/删除"数据时,都会新建一个数组,并将更新后的数据拷贝到新建的数组中,最后再将该数组赋值给"volatile数组",这就是它叫做CopyOnWriteArrayList的原因

        1.2  由于它在"添加/修改/删除"数据时,都会新建数组,所涉及到修改数据的操作,CopyOnWriteArrayList 效率很低;但是只有遍历查询的话效率会比较高。

      2. "线程安全"机制

        2.1   通过 valitile和互斥锁来实现

        2.2  通过 valitile数组来保存数据。一个线程读取volatile数组时,总能看到其它线程对该volatile变量最后的写入;就这样,通过volatile提供了"读取到的数据总是最新的" 这个机制的保证。

        2.3  通过互斥锁来保护数据。在"添加/修改/删除"数据时,会先"获取互斥锁"再修改完毕之后,先将数据更新到"volatile数组"中,然后再“释放互斥锁”,就达到保护数据的目的。

        4.5 小结

        4.5.1 线程安全与线程不安全集合

        集合类型中存在线程安全与线程不安全的两种,常见例如:

        ArrayList ---- Vector

        HashMap ---- HashTable

        但是以上都是通过synchronized关键字实现,效率极低。

        4.5.2 Collections构建的线程安全集合

        4.5.3 CopyOnWriteArrayList

        CopyOnWriteArrayList、CopyOnWriteArraySet 类型,通过动态数组与线程安全个方面保证线程安全。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值