一、概念
1. 什么是线程安全
当多个线程访问一个对象时,如果不用考虑这些线程在运行时环境下的调度和交替执行,也不需要进行额外的同步,或者在调用方进行任何其他的协调操作,调用这个对象的行为都可以获得正确的结果,那这个对象是线程安全的。
通俗来说就是:不管业务中遇到怎么的多个线程访问某个对象或某个方法的情况,而在编写这个业务逻辑的时候,都不需要额外做任何额外的处理(也就是可以像单线程编程一样),程序也可以正常运行(不会因为多线程而出错),就可以称为线程安全。
2. 什么是线程不安全:
多个线程同时做一个操作时,如使用 set 设置一个对象的值时,如果同时有另一个线程使用 get 方法取该对象的值,就有可能取到不正确的值,这种情况就需要我们进行额外的操作保证结果正确,如Synchronized关键词修饰做同步
3. 那为什么不全部设计为线程安全:
主要考虑到运行速度、设计成本等因素。
二、出现线程安全的案例
什么情况下会出现线程安全问题,怎么避免?
- 运行
结果错误
:a++多线程下出现消失的请求现象。 - 线程的
活跃性
问题:死锁、活锁、饥饿 - 对象
发布和初始化
的时候的安全问题
1. a++ 在多线程下出现的数据运算出错
代码演示:
public class MultiThreadsError implements Runnable {
static MultiThreadsError multiThreadsError = new MultiThreadsError();
int index = 0;
public static void main(String[] args) throws InterruptedException {
Thread thread1 = new Thread(multiThreadsError);
Thread thread2 = new Thread(multiThreadsError);
thread1.start();
thread2.start();
thread1.join();
thread2.join();
System.out.println(multiThreadsError.index);
}
@Override
public void run() {
for (int i = 0; i < 10000; i++) {
index++;
}
}
}
结果如下:
两个线换各执行 10000 次 +1,结果却不是20000,运行过程中出现了什么问题呢?分析如下:
如上图,对于i++
这一步,两个线程之间会获取 i
的值然后去执行 ++
,比如线程1 拿到i
时i=1
,在执行 i+1
时,线程2又拿到了i
,这时依然是 i=1
(因为线程1还没有运算结束),线程2也进行i+1
,这就导致两个线程都计算的结果都是2,然后都给i
赋值,最终i=2
,但其实是i+1
执行了两次,结果应该是i=3
,运算结果不符合预期;结果也就导致上面代码中的打印结果。
那么 a++ 具体在哪里冲突了?又冲突了几次??我们可以尝试作如下改进,打印出出错的地方
public class MultiThreadsError implements Runnable {
static MultiThreadsError multiThreadsError = new MultiThreadsError();
// 通过一个boolean数组来标记已经++了的下标为true值,若如果已经为true,那么打印下标为越界线程错误的话;
final boolean[] marked = new boolean[100000];
int index = 0;
// AtomicInteger为细化步骤,就会让这次操作不会出现线程不安全操作,这里用他记录错误/正确次数
static AtomicInteger realInt = new AtomicInteger();//正确次数
static AtomicInteger errorInt = new AtomicInteger();//错误次数
//有参构造参数为2,代表需要等待两个线程经过,再放行
static volatile CyclicBarrier cyclicBarrier1 = new CyclicBarrier(2);
static volatile CyclicBarrier cyclicBarrier2 = new CyclicBarrier(2);
public static void main(String[] args) throws InterruptedException {
Thread thread1 = new Thread(multiThreadsError);
Thread thread2 = new Thread(multiThreadsError);
thread1.start();
thread2.start();
thread1.join();
thread2.join();
System.out.println(multiThreadsError.index);
System.out.println("正确次数为:"+realInt);
System.out.println("错误次数为:"+errorInt);
}
@Override
public void run() {
marked[0] = true;
for (int i = 0; i < 10000; i++) {
//设置栅栏
try {
cyclicBarrier2.reset();
cyclicBarrier1.await();
} catch (InterruptedException e) {
e.printStackTrace();
} catch (BrokenBarrierException e) {
e.printStackTrace();
}
index++;
try {
cyclicBarrier1.reset();
cyclicBarrier2.await();
} catch (InterruptedException e) {
e.printStackTrace();
} catch (BrokenBarrierException e) {
e.printStackTrace();
}
// 原子整数,是线程安全的,用来计数 ++ 执行的次数
realInt.incrementAndGet();
synchronized (multiThreadsError){
// 如果已经为true,说明此时的index所在的位置已经执行过一次 ++ 了,那么打印下标为越界线程错误的话;
// if (marked[index]){
if (marked[index] && marked[index-1]){
// 原子整数,是线程安全的,用来失败的次数
errorInt.incrementAndGet();
System.out.println("该下标【"+index+"】越界被标记过了");
}
marked[index] = true;
}
}
}
}
(1)定义 boolean[] marked 数组和 marked[index] = true 的作用?
通过一个boolean数组来标记已经++了的下标为true值,若如果已经为true,那么说明此时的 index 的当前值已经执行过一次 ++ 了,那就说明遇到了 index++ 冲突;
(1) 这里使用到了 CyclicBarrier 类,原因如下:
假设i=4
时,线程1和2遇到冲突,计算之后都给i
赋值了5,本该是一次错误运算,但是如果遇到下面的情景会将其认为是正确运算:此时的i=5
,线程1先拿到锁后设置 marked[5]=true
,然后线程1释放锁,此时线程1执行特别快,在线程2拿到锁时,线程1已经又执行了一次index++
,此时的 index=6
,线程2运行 if (marked[index])
时,即 marked[6]
明显还没设置,就不会认为是已经失败了。所以为了避免这种场景,保证线程1和2在交换锁期间,两个线程都只有一次 index++ 运算,就用到了 CyclicBarrier 类。
(2) 上面代码中为什么使用 if (marked[index] && marked[index-1])
,而不是使用if (marked[index])
,来作为失败运算的标记呢?
因为如果两个线程的 index++ 如果没有冲突的话,上个循环中的 index,和本次循环中的 index 应该是相差2,也就表示中间会少设置一个 marked[index],但是如果 marked[index-1] 已经被设置了,那就说明本次循环,两个线程的 index++ 冲突了,但是有一个特殊 marked[0],该值无论成功与否,都不会设置,所以需要在 run() 方法开头加上 marked[0] = true;
打印结果如下:
可以看到错误的次数和 表面上结果相加刚好是20000,同时也打印了发生错误的位置是19143,从而更清晰地知道哪里发生了 index++ 冲突。
2. 线程的活跃性
问题:死锁、活锁、饥饿
这里以死锁为例,代码展示如下:
public class MultiThreadError implements Runnable {
int flag = 1;
static Object o1 = new Object();
static Object o2 = new Object();
public static void main(String[] args) {
MultiThreadError r1 = new MultiThreadError();
MultiThreadError r2 = new MultiThreadError();
r1.flag=1;
r2.flag=0;
Thread thread1 = new Thread(r1);
Thread thread2 = new Thread(r2);
thread1.start();
thread2.start();
}
@Override
public void run() {
System.out.println("flag: "+flag);
if (flag==1){
synchronized (o1){
try {
Thread.sleep(500);
} catch (InterruptedException e) {
e.printStackTrace();
}
synchronized (o2){
System.out.println("1");
}
}
}
if (flag==0){
synchronized (o2){
try {
Thread.sleep(500);
} catch (InterruptedException e) {
e.printStackTrace();
}
synchronized (o1){
System.out.println("1");
}
}
}
}
}
结果如下:
在打印出上面两行之后,便不会再进行打印,而且程序也不会终止,这就是死锁。两个线程首先都各自持有一个锁,然后去抢夺另一把锁,但是要抢夺的锁都已经心有所属,分别就是所属于对方,于是两个线程就一直干耗着,进退两难,成了死局。
3. 对象发布和初始化的时候的安全问题
什么是对象发布:
让这个对象在超过这个类的范围去使用。比如先使用 public 声明这个类,那么这个类就是被发布出去了,那怎么超过这个类的范围去使用呢,如下:
- 如果一个方法内 return 返回了一个对象的话,任何调用这个方法的类,都会获取到这个对象
- 将某类的对象作为参数传递到其他类中,也是该类的对象脱离了本类,进入其他对象中
什么是逸出:
某个被发布到不该发布的地方,比如:
- 方法返回一个private对象(private对象本身是不让外部访问)
- 还未完成初始化(构造函数没完全执行完毕)就把对象提供给外界,比如以下几种情况:
- 在构造函数中未初始化完毕就给外部对象赋值this实例
- 隐式逸出——注册监听事件
- 在构造函数中运行子线程
3.1 方法返回一个private对象
(1) 代码展示:
public class MultiThreadError3 {
private Map<String,String> states;
public MultiThreadError3(){
states=new HashMap<>();
states.put("1","周一");
states.put("2","周二");
states.put("3","周三");
states.put("4","周四");
states.put("5","周五");
states.put("6","周六");
states.put("7","周七");
}
//这里逸出了
public Map<String,String> getStates(){
return states;
}
//导致下面可以获取修改states对象的内容
public static void main(String[] args) {
MultiThreadError3 multiThreadError3 = new MultiThreadError3();
Map<String, String> states = multiThreadError3.getStates();
System.out.println(states.get("1"));
states.remove("1");
System.out.println(states.get("1"));
}
}
打印结果如下:
states
这个Map 对象 本来是 MultiThreadError3
类私有的,但是在 getStates()
方法中被 return 出去了,那么外部就能拿到这个states ,而且甚至能对它进行操作,修改里面的值,这就可能造成很严重的安全问题。
解决方案:
通过返回副本的方式,避免直接让这个对象暴露给外界。
/**
* 描述: 返回副本,解决逸出
*/
public class MultiThreadsError3 {
private Map<String, String> states;
public MultiThreadsError3() {
states = new HashMap<>();
states.put("1", "周一");
states.put("2", "周二");
states.put("3", "周三");
states.put("4", "周四");
}
public Map<String, String> getStates() {
return states;
}
public Map<String, String> getStatesImproved() {
return new HashMap<>(states);
}
public static void main(String[] args) {
MultiThreadsError3 multiThreadsError3 = new MultiThreadsError3();
Map<String, String> states = multiThreadsError3.getStates();
// System.out.println(states.get("1"));
// states.remove("1");
// System.out.println(states.get("1"));
System.out.println(multiThreadsError3.getStatesImproved().get("1"));
multiThreadsError3.getStatesImproved().remove("1");
System.out.println(multiThreadsError3.getStatesImproved().get("1"));
}
}
打印结果:
3.2 还未完成初始化(构造函数没完全执行完毕)就把this对象提供给外界
(1)代码演示:在构造函数中未初始化完毕就给外界对象赋值
public class MultiThreadsError4 {
static Point point;
public static void main(String[] args) throws InterruptedException {
new PointMaker().start();
Thread.sleep(10);
if (point != null) {
System.out.println(point);
}
Thread.sleep(105);
if (point != null) {
System.out.println(point);
}
}
}
class Point {
private final int x, y;
public Point(int x, int y) throws InterruptedException {
this.x = x;
MultiThreadsError4.point = this;
Thread.sleep(100);
this.y = y;
}
@Override
public String toString() {
return x + "," + y;
}
}
class PointMaker extends Thread {
@Override
public void run() {
try {
new Point(1, 1);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
打印结果:
因为x的初始化比 y 要早一点,并且在构造函数中有线程睡眠,就可能导致在 main 函数中不同的时间输出的结果不一样,比如上图在main 函数中 Thread.sleep(10) 之后打印出的结果,和 Thread.sleep(105)之后打印出的结果不一样
(2) 代码演示:隐式逸出——注册监听事件
/**
* 观察者模式
*/
public class MultiThreadsError5 {
private int count;
public MultiThreadsError5(MySource source) {
source.registerListener(new EventListener() {
@Override
public void onEvent(Event e) {
System.out.println("\n我得到的数字是" + count);
}
});
//模拟业务操作
for (int i = 0; i < 10000; i++) {
System.out.print(i);
}
count = 100;
}
public static void main(String[] args) {
MySource mySource = new MySource();
new Thread(() -> {
try {
Thread.sleep(10);
} catch (InterruptedException e) {
e.printStackTrace();
}
mySource.eventCome(new Event() {
});
}).start();
new MultiThreadsError5(mySource);
}
static class MySource {
private EventListener listener;
void registerListener(EventListener eventListener) {
this.listener = eventListener;
}
void eventCome(Event e) {
if (listener != null) {
listener.onEvent(e);
} else {
System.out.println("还未初始化完毕");
}
}
}
interface EventListener {
void onEvent(Event e);
}
interface Event {
}
}
结果如下:
结果为什么是0而不是100呢?
在 new EventListener()
这个匿名内部类中,引用了外部类的 count
变量,这个匿名内部类就可以对它进行操作,如果 count 的值在构造函数中还没有初始化完成,就对该 count 进行操作,就导致count的值不准确。、
解决方案:
使用工厂模式,将构造器私有化不对外暴露,对外暴露一个方法:等做完所需的操作之后再 return 发布出去,就不会有实例过早被暴露的问题了。
/**
* 描述: 用工厂模式修复刚才的初始化问题
*/
public class MultiThreadsError7 {
int count;
private EventListener listener;
private MultiThreadsError7(MySource source) {
listener = new EventListener() {
@Override
public void onEvent(MultiThreadsError5.Event e) {
System.out.println("\n我得到的数字是" + count);
}
};
for (int i = 0; i < 10000; i++) {
System.out.print(i);
}
count = 100;
}
public static MultiThreadsError7 getInstance(MySource source) {
MultiThreadsError7 safeListener = new MultiThreadsError7(source);
source.registerListener(safeListener.listener);
return safeListener;
}
public static void main(String[] args) {
MySource mySource = new MySource();
new Thread(new Runnable() {
@Override
public void run() {
try {
Thread.sleep(10);
} catch (InterruptedException e) {
e.printStackTrace();
}
mySource.eventCome(new MultiThreadsError5.Event() {
});
}
}).start();
MultiThreadsError7 multiThreadsError7 = new MultiThreadsError7(mySource);
}
static class MySource {
private EventListener listener;
void registerListener(EventListener eventListener) {
this.listener = eventListener;
}
void eventCome(MultiThreadsError5.Event e) {
if (listener != null) {
listener.onEvent(e);
} else {
System.out.println("还未初始化完毕");
}
}
}
interface EventListener {
void onEvent(MultiThreadsError5.Event e);
}
interface Event {
}
}
打印结果:
(3) 在构造函数中新建线程
/**
* 构造函数中新建线程
*/
public class MultiThreadError6 {
private Map<String,String> states;
public MultiThreadError6(){
new Thread(new Runnable() {
@Override
public void run() {
states=new HashMap<>();
states.put("1","周一");
states.put("2","周二");
states.put("3","周三");
states.put("4","周四");
states.put("5","周五");
states.put("6","周六");
states.put("7","周七");
}
}).start();
}
public Map<String,String> getStates(){
return states;
}
public static void main(String[] args) {
MultiThreadError6 multiThreadError6 = new MultiThreadError6();
System.out.println(multiThreadError6.states.get("1"));
}
}
打印结果:
上图所示:出现了空指针的情况 ,因为初始化的操作在另外一个线程中,可能那个线程没有执行完毕,就会出现空指针,假如在 System.out.println(multiThreadError6.states.get("1"));
之前 加入 Thread.sleep(1000)
休眠一段时间后等另外一个线程执行完,就不会出现这个问题了。
三、总结
1. 各种需要考虑线程安全的情况,如下:
-
访问共享的变量或资源,会有并发风险,这里的共享变量或资源指的是:对象的属性,静态变量,共享缓存,数据库等等。
-
所有依赖时序的操作,即可以拆分成多个步骤的操作,即使每一步操作都是线程安全的,但是如果存在操作时序不对,还是存在并发问题,比如:read-modify-write(先读取再修改最后写入)、 check-then-act(先检查再操作)
-
不同的数据之间存在捆绑关系的时候,那就要么把这些捆绑的数据全部修改,要么都不修改
-
在使用其他类的时候,如果该类没有声明自己是线程安全的,那就要注意该类可能是线程不安全的
2. 多线程除了安全问题,还可能会导致性能问题:
从某种程度上来讲,多线程可以提高复杂的运算效率,但是一定程度上多线程可能会带来性能提交,比如多线程间的调度和协作带来的性能开销。
(1)调度:上下文切换
线程运行个数超过CPU核心数的时候,CPU就需要对线程进行调度,线程调度中就涉及线程切换,线程的切换的开销是很大的,CPU需要保存当前线程的运行场景,将当前线程的当前运行状态保存好,为载入新的运行线程做准备。这样来来回回其实是很耗费性能的。而引起密集的上下文切换的操作就包括抢锁和IO操作。
(2)协作:内存同步
多个线程之间,针对数据的同步其实大部分是基于 JMM 模型的,这种需要我们后续详细学习并总结,这里只是需要知道,多个线程之间,同步数据也是多线程消耗性能的一个原因。