多线程进阶：常见数据结构的安全性分析

一只咸鱼。。

已于 2022-08-12 09:33:33 修改

阅读量1.3k

点赞数 8

分类专栏： Java数据结构 Java多线程与并发文章标签：数据结构 java servlet

于 2022-08-08 15:45:05 首次发布

本文链接：https://blog.csdn.net/qq15035899256/article/details/125961682

版权

Java数据结构同时被 2 个专栏收录

16 篇文章 1 订阅

订阅专栏

Java多线程与并发

13 篇文章 2 订阅

订阅专栏

文章目录

一、常见数据结构
二、ArrayList
- 2-1 线程不安全的原因
- 2-2 Vector实现安全
三、CopyOnWriteArrayList
四、HashMap
- 4-1 底层原理
- 4-2 线程不安全的原因
五、ConcurrentHashMap
- 5-1 实现原理
- 5-2 与Hashtable的区别

提示：以下是本篇文章正文内容，Java系列学习将会持续更新

一、常见数据结构

非线程安全的数据结构：ArrayList,LinkedList,ArrayQueue,HashMap,HashSet

线程安全的数据结构：Vector,Stack,Hashtable,CopyOnWriteArrayList,ConcurrentHashMap

二、ArrayList

2-1 线程不安全的原因

看源码

public boolean add(E e) {
	ensureCapacityInternal(size + 1);  // Increments modCount!!
    // 该方法是容量保障，当容纳不下新增的元素时会进行扩容
    elementData[size++] = e;
    return true;
}

分析:

当数组长度为10，而size = 9时，此时A线程判断可以容纳，B线程也来判断发现可以容纳（这是因为add非原子操作）。当A添加完之后，B线程再添加的话，就会报错（数组越界异常）
而且这一步elementData[size++] = e也非原子性的.
可以拆分为elementData[size] = e 和 size ++;
在多线程的情况下很容易出现elementData[size] = e1; elementData[size] = e2; size++; size++; 的情况

2-2 Vector实现安全

Vector的add()源码：

	public synchronized void addElement(E obj) {
        modCount++;
        ensureCapacityHelper(elementCount + 1);
        elementData[elementCount++] = obj;
    }

分析:
Vector的add方法加了synchronized ，而ArrayList没有，所以ArrayList线程不安全，但是，由于Vector加了synchronized ，变成了串行，所以效率低。

回到目录…

三、CopyOnWriteArrayList

CopyOnWrite容器即写时复制的容器。

// java.util.concurrent包下
List<String> list = new CopyOnWriteArrayList<String>();

3-1 如何实现线程安全？

通俗的理解是当我们往一个容器添加元素的时候，不直接往当前容器添加，而是先将当前容器进行Copy，复制出一个新的容器，然后新的容器里添加元素，添加完元素之后，再将原容器的引用指向新的容器。

这样做的好处是我们可以对CopyOnWrite容器进行并发的读，而不需要加锁，因为当前容器不会添加任何元素。所以CopyOnWrite容器也是一种读写分离的思想，读和写不同的容器。

3-2 特征

CopyOnWriteArrayList（写数组的拷贝）是ArrayList的一个线程安全的变体，CopyOnWriteArrayList和CopyOnWriteSet都是线程安全的集合，其中所有可变操作（add、set等等）都是通过对底层数组进行一次新的复制来实现的。
它绝对不会抛出ConcurrentModificationException的异常。因为该列表（CopyOnWriteArrayList）在遍历时将不会被做任何的修改。
CopyOnWriteArrayList适合用在“读多，写少”的并发场景中，比如缓存、白名单、黑名单。它不存在“扩容”的概念，每次写操作（add or remove）都要copy一个副本，在副本的基础上修改后改变array引用，所以称为“CopyOnWrite”，因此在写操作要加锁，并且对整个list的copy操作时相当耗时的，过多的写操作不推荐使用该存储结构。
读的时候不需要加锁，如果读的时候有多个线程正在向CopyOnWriteArrayList添加数据，读还是会读到旧的数据，因为开始读的那一刻已经确定了读的对象是旧对象。

3-3 缺点

在写操作时，因为复制机制，会导致内存占用过大。
不能保证实时性的数据一致，“脏读”。

回到目录…

四、HashMap

4-1 底层原理

不清楚的小白看看之前两篇文章，就可以很容易搞懂HashMap的底层实现原理了。

Java数据结构之哈希表

JDK中的Set和Map解析

4-2 线程不安全的原因

单看 HashMap 中的 put 操作：

JDK1.7头插法 –> 将链表变成环 –> 死循环
JDK1.8尾插法 –> 数据覆盖

回到目录…

五、ConcurrentHashMap

// java.util.concurrent包下
Map<Integer, String> map = new ConcurrentHashMap<>();

5-1 实现原理

JDK1.7时，采用分段锁，将一个大哈希表默认分为16段的哈希表，同一个小表内互斥。用的是 Lock 锁。
JDK1.8时加入了红黑树，且只针对同一链表内互斥，不是同一链表内的操作就不需要互斥。用的是synchronized锁。
但是一旦遇到需要扩容的时候，涉及到所有链表，此时就不是简单的互斥了。