arraylist线程安全吗_超详细 | 21张图带你领略集合的线程不安全

982c0575cd096128c95485f1c59c2b87.gif 689dd96ec13001674ae1711e528549f2.png 来源 | 悟空聊架构 本篇主要内容如下:
5b823a700e7edaab916b09e00705f4b0.png

本篇主要内容

本篇所有示例代码已更新到 我的Github 本篇文章已收纳到我的Java在线文档

b17728057d4a652ac106b8efdc130776.png

线程不安全之ArrayList

集合框架 有Map和Collection两大类,Collection下面有List、Set、Queue。List 下面有 ArrayList、Vector、LinkedList。如下图所示:

5b88ebe1551041f0d240d4908fef3ce4.png

集合框架思维导图

JUC并发包 下的集合类Collections有Queue、CopyOnWriteArrayList、CopyOnWriteArraySet、ConcurrentMap

8d7b3ada37f040d84884cde0a506d8ef.png

JUC包下的Collections

我们先来看看 ArrayList。

1.1、ArrayList 的底层初始化操作

首先我们来复习下ArrayList的使用,下面是初始化一个ArrayList,数组存放的是 Integer 类型的值。

new ArrayList<Integer>();

那么底层做了什么操作呢?

1.2、ArrayList 的底层原理

1.2.1 初始化数组

/**
 * Constructs an empty list with an initial capacity of ten.
 */public ArrayList() {this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

创建了一个空数组,容量为0,根据官方的英文注释,这里容量应该为10,但其实是0,后续会讲到为什么不是10。

1.2.2 ArrayList 的 add 操作

public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;return true;
}

重点是这一步:elementData[size++] = e; size++ 和 elementData[xx]=e,这两个操作都不是原子操作(不可分割的一个或一系列操作,要么都成功执行,要么都不执行)。
1.2.3 ArrayList 扩容源码解析
(1)执行 add 操作时,会先确认是否超过数组大小。

ensureCapacityInternal(size + 1);

0e002696457afbe0ec7c574aea645fdc.png

ensureCapacityInternal方法

(2)计算数组的当前容量 calculateCapacity。

private void ensureCapacityInternal(int minCapacity) {
    ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}

minCapacity : 值为1 elementData:代表当前数组 我们先看 ensureCapacityInternal 调用的 ensureCapacityInternal 方法:

calculateCapacity(elementData, minCapacity)

calculateCapacity方法如下:

private static int calculateCapacity(Object[] elementData, int minCapacity) {if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {return Math.max(DEFAULT_CAPACITY, minCapacity);
    }return minCapacity;
}

elementData:代表当前数组,添加第一个元素时,elementData 等于DEFAULTCAPACITY_EMPTY_ELEMENTDATA(空数组)。 minCapacity:等于1 DEFAULT_CAPACITY:等于10 返回 Math.max(DEFAULT_CAPACITY, minCapacity) = 10。 小结:所以第一次添加元素时,计算数组的大小为10。 (3)确定当前容量 ensureExplicitCapacity。 1dfd676c39a8d5bfbb464d80d3b63273.png

ensureExplicitCapacity方法

minCapacity = 10 elementData.length=0 小结:因minCapacity > elementData.length,所以进行第一次扩容,调用grow()方法从0扩大到10。 (4)调用 grow 方法。 8474c2c3d18f95251a9f0f9796f607f1.png

grow方法

oldCapacity=0,newCapacity=10。 然后执行 elementData = Arrays.copyOf(elementData, newCapacity); 将当前数组和容量大小进行数组拷贝操作,赋值给elementData。 数组的容量设置为10。 elementData的值和DEFAULTCAPACITY_EMPTY_ELEMENTDATA的值将会不一样。 (5)然后将元素赋值给数组第一个元素,且size自增1。

elementData[size++] = e;

(6)添加第二个元素时,传给ensureCapacityInternal的是2。

ensureCapacityInternal(size + 1)

size=1,size+1=2 (7)第二次添加元素时,执行 calculateCapacity。 609d4e00823e79cf57cd92135684c789.png

mark

elementData的值和DEFAULTCAPACITY_EMPTY_ELEMENTDATA的值不相等,所以直接返回2。 (8)第二次添加元素时,执行 ensureExplicitCapacity。 因minCapacity等于2,小于当前数组的长度10,所以不进行扩容,不执行grow方法。 6f1999fb368a6d902fa3ec211d5844e9.png

mark

(9)将第二个元素添加到数组中,size自增1。

elementData[size++] = e

(10)当添加第11个元素时调用grow方法进行扩容。 9b179a9c06b7c2adab929b512821bbe6.png
mark
minCapacity=11, elementData.length=10,调用grow方法。 (11)扩容1.5倍。
int newCapacity = oldCapacity + (oldCapacity >> 1);
oldCapacity=10,先换算成二级制1010,然后右移一位,变成0101,对应十进制5,所以newCapacity=10+5=15,扩容1.5倍后是15。 6934f4ffab242273f9644b9616171808.png
扩容1.5倍
(12)小结
  • 1.ArrayList初始化为一个空数组。
  • 2.ArrayList的Add操作不是线程安全的。
  • 3.ArrayList添加第一个元素时,数组的容量设置为10。
  • 4.当ArrayList数组超过当前容量时,扩容至1.5倍(遇到计算结果为小数的,向下取整),第一次扩容后,容量为15,第二次扩容至22...
  • 5.ArrayList在第一次和扩容后都会对数组进行拷贝,调用Arrays.copyOf方法。

1.3、ArrayList单线程环境是否安全?

场景: 我们通过一个添加积木的例子来说明单线程下ArrayList是线程安全的。 将 积木 三角形A、四边形B、五边形C、六边形D、五角星E依次添加到一个盒子中,盒子中共有5个方格,每一个方格可以放一个积木。 b70076a5c9072645eca3d092ac76a1c6.png
ArrayList单线程下添加元素
代码实现: (1)这次我们用新的积木类 BuildingBlockWithName 这个积木类可以传形状shape和名字name:

/**
 * 积木类
 * @author: 悟空聊架构
 * @create: 2020-08-27
 */class BuildingBlockWithName {
    String shape;
    String name;public BuildingBlockWithName(String shape, String name) {this.shape = shape;this.name = name;
    }@Overridepublic String toString() {return "BuildingBlockWithName{" + "shape='" + shape + ",name=" + name +'}';
    }
}

(2)初始化一个ArrayList

ArrayList<BuildingBlock> arrayList = new ArrayList<>();

(3)依次添加三角形A、四边形B、五边形C、六边形D、五角星E。

arrayList.add(new BuildingBlockWithName("三角形", "A"));
arrayList.add(new BuildingBlockWithName("四边形", "B"));
arrayList.add(new BuildingBlockWithName("五边形", "C"));
arrayList.add(new BuildingBlockWithName("六边形", "D"));
arrayList.add(new BuildingBlockWithName("五角星", "E"));

(4)验证arrayList中元素的内容和顺序是否和添加的一致:

BuildingBlockWithName{shape='三角形,name=A}
BuildingBlockWithName{shape='四边形,name=B}
BuildingBlockWithName{shape='五边形,name=C}
BuildingBlockWithName{shape='六边形,name=D}
BuildingBlockWithName{shape='五角星,name=E}

我们看到结果确实是一致的。 小结: 单线程环境中,ArrayList是线程安全的。

1.4、多线程下ArrayList是不安全的

场景如下:20个线程随机往ArrayList添加一个任意形状的积木。 995bb36bf8b8aee3cdcadb2633312dfb.png
多线程场景往数组存放元素
(1)代码实现:20个线程往数组中随机存放一个积木。 6c63da3bf884ba35cb59b60db4b8af67.png
多线程下ArrayList是不安全的
(2)打印结果:程序开始运行后,每个线程只存放一个随机的积木。 7d2cf3a675a1a46453640356b76026be.png
打印结果
数组中会不断存放积木,多个线程会争抢数组的存放资格,在存放过程中,会抛出一个异常: ConcurrentModificationException(并行修改异常)。

Exception in thread "10" Exception in thread "13" java.util.ConcurrentModificationException

2fdffe814f2b08055aae8cb05a98df6c.png
mark
这个就是常见的并发异常:java.util.ConcurrentModificationException

1.5 那如何解决 ArrayList 线程不安全问题呢?

有如下方案:
  • 用Vector代替ArrayList
  • 用Collections.synchronized(new ArrayList<>())
  • CopyOnWriteArrayList

1.6 Vector 是保证线程安全的?

下面就来分析vector的源码。
1.6.1 初始化 Vector
初始化容量为10

public Vector() {this(10);
}

1.6.2 Add 操作是线程安全的
Add方法加了synchronized,来保证add操作是线程安全的(保证可见性、原子性、有序性),对这几个概念有不懂的可以看下之前的写的文章-》 反制面试官 | 14张原理图 | 再也不怕被问 volatile!
75ff00d41f9624d91f9204dc34f47ff9.png Add方法加了synchronized
1.6.3 Vector 扩容至2倍

int newCapacity = oldCapacity + ((capacityIncrement > 0) ? capacityIncrement : oldCapacity);

2d5ce9b816556ef88a6160e775a4b02e.png
容量扩容至2倍
注意:capacityIncrement 在初始化的时候可以传值,不传则默认为0。如果传了,则第一次扩容时为设置的oldCapacity+capacityIncrement,第二次扩容时扩大1倍。 缺点:虽然保证了线程安全,但因为加了排斥锁synchronized,会造成阻塞,所以性能降低。
1.6.4 用积木模拟Vector的add操作
cad3733004cf2064c09a83916160ef0d.png
vector的add操作
当往vector存放元素时,给盒子加了一个锁,只有一个人可以存放积木,放完后,释放锁,放第二元素时,再进行加锁,依次往复进行。

1.7 使用 Collections.synchronizedList 保证线程安全

我们可以使用Collections.synchronizedList方法来封装一个ArrayList。

List<Object> arrayList = Collections.synchronizedList(new ArrayList<>());

为什么这样封装后,就是线程安全的? 源码解析:因为Collections.synchronizedList封装后的list,list的所有操作方法都是带synchronized关键字的(除iterator()之外),相当于所有操作都会进行加锁,所以使用它是线程安全的(除迭代数组之外)。
af351a4e7a55575e43d1311a49e4760a.png 加锁
bf647a9ccfb6ac1456e7a635f27c6b4c.png
mark
注意:当迭代数组时,需要手动做同步。官方示例如下:

synchronized (list) {
     Iterator i = list.iterator(); // Must be in synchronized blockwhile (i.hasNext())
         foo(i.next());
}

1.8 使用 CopyOnWriteArrayList 保证线程安全

1.8.1 CopyOnWriteArrayList思想
  • Copy on write:写时复制,一种读写分离的思想。
  • 写操作:添加元素时,不直接往当前容器添加,而是先拷贝一份数组,在新的数组中添加元素后,在将原容器的引用指向新的容器。因为数组时用volatile关键字修饰的,所以当array重新赋值后,其他线程可以立即知道(volatile的可见性)。
  • 读操作:读取数组时,读老的数组,不需要加锁。
  • 读写分离:写操作是copy了一份新的数组进行写,读操作是读老的数组,所以是读写分离。
1.8.2 使用方式

CopyOnWriteArrayList<BuildingBlockWithName> arrayList = new CopyOnWriteArrayList<>();

1.8.3 底层源码分析
886a4da9fa66db45a34609909fd2dd9d.png
CopyOnWriteArrayList的add方法分析
add的流程:
  • 先定义了一个可重入锁 ReentrantLock。
  • 添加元素前,先获取锁lock.lock()。
  • 添加元素时,先拷贝当前数组 Arrays.copyOf。
  • 添加元素时,扩容+1(len + 1)。
  • 添加元素后,将数组引用指向新加了元素后的数组setArray(newElements)。
为什么数组重新赋值后,其他线程可以立即知道? 因为这里的数组是用volatile修饰的,哇,又是volatile,这个关键字真妙^_^

 private transient volatile Object[] array;

1.8.4 ReentrantLock 和synchronized的区别
划重点 相同点:
  • 1.都是用来协调多线程对共享对象、变量的访问。
  • 2.都是可重入锁,同一线程可以多次获得同一个锁。
  • 3.都保证了可见性和互斥性。
不同点:
  • 1.ReentrantLock 显示的获得、释放锁, synchronized 隐式获得释放锁。
  • 2.ReentrantLock 可响应中断, synchronized 是不可以响应中断的,为处理锁的不可用性提供了更高的灵活性。
  • 3.ReentrantLock 是 API 级别的, synchronized 是 JVM 级别的。
  • 4.ReentrantLock 可以实现公平锁、非公平锁。
  • 5.ReentrantLock 通过 Condition 可以绑定多个条件。
  • 6.底层实现不一样, synchronized 是同步阻塞,使用的是悲观并发策略, lock 是同步非阻塞,采用的是乐观并发策略。
1.8.5 Lock和synchronized的区别
  • 1.Lock需要手动获取锁和释放锁。就好比自动挡和手动挡的区别。
  • 2.Lock 是一个接口,而 synchronized 是 Java 中的关键字, synchronized 是内置的语言实现。
  • 3.synchronized 在发生异常时,会自动释放线程占有的锁,因此不会导致死锁现象发生;而 Lock 在发生异常时,如果没有主动通过 unLock()去释放锁,则很可能造成死锁现象,因此使用 Lock 时需要在 finally 块中释放锁。
  • 4.Lock 可以让等待锁的线程响应中断,而 synchronized 却不行,使用 synchronized 时,等待的线程会一直等待下去,不能够响应中断。
  • 5.通过 Lock 可以知道有没有成功获取锁,而 synchronized 却无法办到。
  • 6.Lock 可以通过实现读写锁提高多个线程进行读操作的效率。

335dfa32cace821599aa4de2f06332bd.png

线程不安全之 HashSet

有了前面大篇幅的讲解 ArrayList 的线程不安全,以及如何使用其他方式来保证线程安全,现在讲HashSet应该更容易理解一些。

2.1 HashSet的用法

用法如下:

 Set Set = new HashSet<>();
set.add("a");

初始容量=10,负载因子=0.75(当元素个数达到容量的75%,启动扩容)
2.2 HashSet的底层原理

 public HashSet() {map = new HashMap<>();
}

底层用的还是HashMap()。 考点:为什么HashSet的add操作只用传一个参数(value),而HashMap需要传两个参数(key和value)?

2.3 HashSet的add操作

private static final Object PRESENT = new Object();public boolean add(E e) {return map.put(e, PRESENT)==null;
}

考点回答: 因为HashSet的add操作中,key等于传的value值,而value是PRESENT,PRESENT是new Object();,所以传给map的是 key=e,  value=new Object。Hash只关心key,不考虑value。

为什么HashSet不安全:底层add操作不保证可见性、原子性。所以不是线程安全的。

2.4 如何保证线程安全

1.使用 Collections.synchronizedSet

Set set = Collections.synchronizedSet(new HashSet<>());

2.使用 CopyOnWriteArraySet

CopyOnWriteArraySet set = new CopyOnWriteArraySet<>();

2.5 CopyOnWriteArraySet 的底层还是使用的是 CopyOnWriteArrayList

public CopyOnWriteArraySet() {
    al = new CopyOnWriteArrayList();
}

6b370dc82b7fc804a27ea5052c582191.png

线程不安全之HashMap

3.1 HashMap 的使用

同理,HashMap和HashSet一样,在多线程环境下也是线程不安全的。

Map map = new HashMap<>();map.put("A", new BuildingBlockWithName("三角形", "A"));

3.2 HashMap线程不安全解决方案:

  • 1.Collections.synchronizedMap

Map<String, BuildingBlockWithName> map2 = Collections.synchronizedMap(new HashMap<>()); 

  • 2.ConcurrentHashMap

ConcurrentHashMap<String, BuildingBlockWithName> set3 = new ConcurrentHashMap<>();

3.3 ConcurrentHashMap原理

ConcurrentHashMap,它内部细分了若干个小的 HashMap,称之为段(Segment)。默认情况下一个 ConcurrentHashMap 被进一步细分为 16 个段,既就是锁的并发度。如果需要在 ConcurrentHashMap 中添加一个新的表项,并不是将整个 HashMap 加锁,而是首先根据 hashcode 得到该表项应该存放在哪个段中,然后对该段加锁,并完成 put 操作。在多线程环境中,如果多个线程同时进行put操作,只要被加入的表项不存放在同一个段中,则线程间可以做到真正的并行。

afaf55f2481b7bd8b82280891649090d.png

其他的集合类

LinkedList: 线程不安全,同ArrayListTreeSet:线程不安全,同HashSetLinkedHashSet:线程不安全,同HashSetTreeMap:同HashMap,线程不安全;HashTable:线程安全。

5172ccb72129a8697840d2d8f7f32459.png

总结

本篇第一个部分详细讲述了ArrayList集合的底层扩容原理,演示了ArrayList的线程不安全会导致抛出并发修改异常。然后通过源码解析的方式讲解了三种方式来保证线程安全:
  • Vector是通过在add等方法前加synchronized来保证线程安全。
  • Collections.synchronized()是通过包装数组,在数组的操作方法前加synchronized来保证线程安全。
  • CopyOnWriteArrayList通过写时复制来保证线程安全的。
第二部分讲解了HashSet的线程不安全性,通过两种方式保证线程安全:
  • Collections.synchronizedSet
  • CopyOnWriteArraySet
第三部分讲解了HashMap的线程不安全性,通过两种方式保证线程安全:
  • Collections.synchronizedMap
  • ConcurrentHashMap
另外在讲解的过程中,也详细对比了ReentrantLock和synchronized及Lock和synchronized的区别。 彩蛋:聪明的你,一定发现集合里面还漏掉了一个重要的东西:那就是Queue。期待后续么?

ea40e028e9aec95158728aebf4c6e56b.png

更多阅读推荐

  • 云起云涌:PaaS 体系架构与运维系统上云实践威胁无所遁形

  • 该买哪家二手手机呢?程序员爬取京东告诉你

  • 17 年安全界老兵,专注打造容器安全能行吗?

  • 字节跳动斩获支付牌照欲建金融帝国,技术实力配得上野心吗?

  • 腾讯微博即将关停,十年了,你用过吗?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值