多线程安全的案例展示与解决方案

一、概念

1. 什么是线程安全

当多个线程访问一个对象时,如果不用考虑这些线程在运行时环境下的调度和交替执行,也不需要进行额外的同步,或者在调用方进行任何其他的协调操作,调用这个对象的行为都可以获得正确的结果,那这个对象是线程安全的。

通俗来说就是:不管业务中遇到怎么的多个线程访问某个对象或某个方法的情况,而在编写这个业务逻辑的时候,都不需要额外做任何额外的处理(也就是可以像单线程编程一样),程序也可以正常运行(不会因为多线程而出错),就可以称为线程安全。

2. 什么是线程不安全:

多个线程同时做一个操作时,如使用 set 设置一个对象的值时,如果同时有另一个线程使用 get 方法取该对象的值,就有可能取到不正确的值,这种情况就需要我们进行额外的操作保证结果正确,如Synchronized关键词修饰做同步

3. 那为什么不全部设计为线程安全:

主要考虑到运行速度、设计成本等因素。

二、出现线程安全的案例

什么情况下会出现线程安全问题,怎么避免?

  • 运行结果错误:a++多线程下出现消失的请求现象。
  • 线程的活跃性问题:死锁、活锁、饥饿
  • 对象发布和初始化的时候的安全问题

1. a++ 在多线程下出现的数据运算出错

代码演示:

public class MultiThreadsError implements Runnable {
    static MultiThreadsError multiThreadsError = new MultiThreadsError();
    int index = 0;

    public static void main(String[] args) throws InterruptedException {
        Thread thread1 = new Thread(multiThreadsError);
        Thread thread2 = new Thread(multiThreadsError);

        thread1.start();
        thread2.start();
        thread1.join();
        thread2.join();
        System.out.println(multiThreadsError.index);
    }

    @Override
    public void run() {
        for (int i = 0; i < 10000; i++) {
            index++;
        }
    }
}

结果如下:

两个线换各执行 10000 次 +1,结果却不是20000,运行过程中出现了什么问题呢?分析如下:

如上图,对于i++这一步,两个线程之间会获取 i 的值然后去执行 ++,比如线程1 拿到ii=1,在执行 i+1时,线程2又拿到了i,这时依然是 i=1(因为线程1还没有运算结束),线程2也进行i+1,这就导致两个线程都计算的结果都是2,然后都给i赋值,最终i=2,但其实是i+1执行了两次,结果应该是i=3,运算结果不符合预期;结果也就导致上面代码中的打印结果。

那么 a++ 具体在哪里冲突了?又冲突了几次??我们可以尝试作如下改进,打印出出错的地方

public class MultiThreadsError implements Runnable {
    static MultiThreadsError multiThreadsError = new MultiThreadsError();
    // 通过一个boolean数组来标记已经++了的下标为true值,若如果已经为true,那么打印下标为越界线程错误的话;
    final boolean[] marked = new boolean[100000];
    int index = 0;
    // AtomicInteger为细化步骤,就会让这次操作不会出现线程不安全操作,这里用他记录错误/正确次数
    static AtomicInteger realInt = new AtomicInteger();//正确次数
    static AtomicInteger errorInt = new AtomicInteger();//错误次数
    
    //有参构造参数为2,代表需要等待两个线程经过,再放行
    static volatile CyclicBarrier cyclicBarrier1 = new CyclicBarrier(2);
    static volatile CyclicBarrier cyclicBarrier2 = new CyclicBarrier(2);
    
    public static void main(String[] args) throws InterruptedException {
        Thread thread1 = new Thread(multiThreadsError);
        Thread thread2 = new Thread(multiThreadsError);

        thread1.start();
        thread2.start();
        thread1.join();
        thread2.join();
        System.out.println(multiThreadsError.index);
        System.out.println("正确次数为:"+realInt);
        System.out.println("错误次数为:"+errorInt);
    }

    @Override
    public void run() {
        marked[0] = true;
        for (int i = 0; i < 10000; i++) {
            //设置栅栏
            try {
                cyclicBarrier2.reset();
                cyclicBarrier1.await();
            } catch (InterruptedException e) {
                e.printStackTrace();
            } catch (BrokenBarrierException e) {
                e.printStackTrace();
            }
            index++;
            try {
                cyclicBarrier1.reset();
                cyclicBarrier2.await();
            } catch (InterruptedException e) {
                e.printStackTrace();
            } catch (BrokenBarrierException e) {
                e.printStackTrace();
            }
            // 原子整数,是线程安全的,用来计数 ++ 执行的次数
            realInt.incrementAndGet();
            synchronized (multiThreadsError){
                // 如果已经为true,说明此时的index所在的位置已经执行过一次 ++ 了,那么打印下标为越界线程错误的话;
                // if (marked[index]){
                if (marked[index] && marked[index-1]){
                    // 原子整数,是线程安全的,用来失败的次数
                    errorInt.incrementAndGet();
                    System.out.println("该下标【"+index+"】越界被标记过了");
                }
                marked[index] = true;
            }
        }
    }
}

(1)定义 boolean[] marked 数组和 marked[index] = true 的作用?

通过一个boolean数组来标记已经++了的下标为true值,若如果已经为true,那么说明此时的 index 的当前值已经执行过一次 ++ 了,那就说明遇到了 index++ 冲突;

(1) 这里使用到了 CyclicBarrier 类,原因如下:

假设i=4时,线程1和2遇到冲突,计算之后都给i赋值了5,本该是一次错误运算,但是如果遇到下面的情景会将其认为是正确运算:此时的i=5,线程1先拿到锁后设置 marked[5]=true,然后线程1释放锁,此时线程1执行特别快,在线程2拿到锁时,线程1已经又执行了一次index++,此时的 index=6,线程2运行 if (marked[index])时,即 marked[6]明显还没设置,就不会认为是已经失败了。所以为了避免这种场景,保证线程1和2在交换锁期间,两个线程都只有一次 index++ 运算,就用到了 CyclicBarrier 类。

(2) 上面代码中为什么使用 if (marked[index] && marked[index-1]),而不是使用if (marked[index]),来作为失败运算的标记呢?

因为如果两个线程的 index++ 如果没有冲突的话,上个循环中的 index,和本次循环中的 index 应该是相差2,也就表示中间会少设置一个 marked[index],但是如果 marked[index-1] 已经被设置了,那就说明本次循环,两个线程的 index++ 冲突了,但是有一个特殊 marked[0],该值无论成功与否,都不会设置,所以需要在 run() 方法开头加上 marked[0] = true;

打印结果如下:

可以看到错误的次数和 表面上结果相加刚好是20000,同时也打印了发生错误的位置是19143,从而更清晰地知道哪里发生了 index++ 冲突。

2. 线程的活跃性问题:死锁、活锁、饥饿

这里以死锁为例,代码展示如下:

public class MultiThreadError implements Runnable {

    int flag = 1;
    static Object o1 = new Object();
    static Object o2 = new Object();

    public static void main(String[] args) {
        MultiThreadError r1 = new MultiThreadError();
        MultiThreadError r2 = new MultiThreadError();
        r1.flag=1;
        r2.flag=0;

        Thread thread1 = new Thread(r1);
        Thread thread2 = new Thread(r2);

        thread1.start();
        thread2.start();
    }

    @Override
    public void run() {
        System.out.println("flag: "+flag);
        if (flag==1){
            synchronized (o1){
                try {
                    Thread.sleep(500);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                synchronized (o2){
                    System.out.println("1");
                }
            }
        }
        if (flag==0){
            synchronized (o2){
                try {
                    Thread.sleep(500);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                synchronized (o1){
                    System.out.println("1");
                }
            }
        }

    }
}

结果如下:

在打印出上面两行之后,便不会再进行打印,而且程序也不会终止,这就是死锁。两个线程首先都各自持有一个锁,然后去抢夺另一把锁,但是要抢夺的锁都已经心有所属,分别就是所属于对方,于是两个线程就一直干耗着,进退两难,成了死局。

3. 对象发布和初始化的时候的安全问题

什么是对象发布

让这个对象在超过这个类的范围去使用。比如先使用 public 声明这个类,那么这个类就是被发布出去了,那怎么超过这个类的范围去使用呢,如下:

  • 如果一个方法内 return 返回了一个对象的话,任何调用这个方法的类,都会获取到这个对象
  • 将某类的对象作为参数传递到其他类中,也是该类的对象脱离了本类,进入其他对象中

什么是逸出

某个被发布到不该发布的地方,比如:

  • 方法返回一个private对象(private对象本身是不让外部访问)
  • 还未完成初始化(构造函数没完全执行完毕)就把对象提供给外界,比如以下几种情况:
    • 在构造函数中未初始化完毕就给外部对象赋值this实例
    • 隐式逸出——注册监听事件
    • 在构造函数中运行子线程
3.1 方法返回一个private对象
(1) 代码展示:
public class MultiThreadError3 {
    private Map<String,String> states;

    public MultiThreadError3(){
        states=new HashMap<>();
        states.put("1","周一");
        states.put("2","周二");
        states.put("3","周三");
        states.put("4","周四");
        states.put("5","周五");
        states.put("6","周六");
        states.put("7","周七");
    }

    //这里逸出了
    public Map<String,String> getStates(){
        return states;
    }

    //导致下面可以获取修改states对象的内容
    public static void main(String[] args) {
        MultiThreadError3 multiThreadError3 = new MultiThreadError3();
        Map<String, String> states = multiThreadError3.getStates();
        System.out.println(states.get("1"));

        states.remove("1");
        System.out.println(states.get("1"));
    }
}

打印结果如下:

states这个Map 对象 本来是 MultiThreadError3类私有的,但是在 getStates() 方法中被 return 出去了,那么外部就能拿到这个states ,而且甚至能对它进行操作,修改里面的值,这就可能造成很严重的安全问题。

解决方案

通过返回副本的方式,避免直接让这个对象暴露给外界。

/**
 * 描述:     返回副本,解决逸出
 */
public class MultiThreadsError3 {

    private Map<String, String> states;

    public MultiThreadsError3() {
        states = new HashMap<>();
        states.put("1", "周一");
        states.put("2", "周二");
        states.put("3", "周三");
        states.put("4", "周四");
    }

    public Map<String, String> getStates() {
        return states;
    }

    public Map<String, String> getStatesImproved() {
        return new HashMap<>(states);
    }

    public static void main(String[] args) {
        MultiThreadsError3 multiThreadsError3 = new MultiThreadsError3();
        Map<String, String> states = multiThreadsError3.getStates();
//        System.out.println(states.get("1"));
//        states.remove("1");
//        System.out.println(states.get("1"));

        System.out.println(multiThreadsError3.getStatesImproved().get("1"));
        multiThreadsError3.getStatesImproved().remove("1");
        System.out.println(multiThreadsError3.getStatesImproved().get("1"));

    }
}

打印结果:

3.2 还未完成初始化(构造函数没完全执行完毕)就把this对象提供给外界
(1)代码演示:在构造函数中未初始化完毕就给外界对象赋值
public class MultiThreadsError4 {

    static Point point;

    public static void main(String[] args) throws InterruptedException {
        new PointMaker().start();
        Thread.sleep(10);
        if (point != null) {
            System.out.println(point);
        }
        Thread.sleep(105);
        if (point != null) {
            System.out.println(point);
        }
    }
}

class Point {

    private final int x, y;

    public Point(int x, int y) throws InterruptedException {
        this.x = x;
        MultiThreadsError4.point = this;
        Thread.sleep(100);
        this.y = y;
    }

    @Override
    public String toString() {
        return x + "," + y;
    }
}

class PointMaker extends Thread {

    @Override
    public void run() {
        try {
            new Point(1, 1);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

打印结果:

因为x的初始化比 y 要早一点,并且在构造函数中有线程睡眠,就可能导致在 main 函数中不同的时间输出的结果不一样,比如上图在main 函数中 Thread.sleep(10) 之后打印出的结果,和 Thread.sleep(105)之后打印出的结果不一样

(2) 代码演示:隐式逸出——注册监听事件
/**
 * 观察者模式
 */
public class MultiThreadsError5 {

    private int count;

    public MultiThreadsError5(MySource source) {
        source.registerListener(new EventListener() {
            @Override
            public void onEvent(Event e) {
                System.out.println("\n我得到的数字是" + count);
            }

        });
        //模拟业务操作
        for (int i = 0; i < 10000; i++) {
            System.out.print(i);
        }
        count = 100;
    }

    public static void main(String[] args) {
        MySource mySource = new MySource();
        new Thread(() -> {
            try {
                Thread.sleep(10);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            mySource.eventCome(new Event() {
            });
        }).start();

        new MultiThreadsError5(mySource);
    }

    static class MySource {

        private EventListener listener;

        void registerListener(EventListener eventListener) {
            this.listener = eventListener;
        }

        void eventCome(Event e) {
            if (listener != null) {
                listener.onEvent(e);
            } else {
                System.out.println("还未初始化完毕");
            }
        }

    }

    interface EventListener {
        void onEvent(Event e);
    }

    interface Event {

    }
}

结果如下:

结果为什么是0而不是100呢?

new EventListener()这个匿名内部类中,引用了外部类的 count变量,这个匿名内部类就可以对它进行操作,如果 count 的值在构造函数中还没有初始化完成,就对该 count 进行操作,就导致count的值不准确。、

解决方案

使用工厂模式,将构造器私有化不对外暴露,对外暴露一个方法:等做完所需的操作之后再 return 发布出去,就不会有实例过早被暴露的问题了。

/**
 * 描述:     用工厂模式修复刚才的初始化问题
 */
public class MultiThreadsError7 {

    int count;
    private EventListener listener;

    private MultiThreadsError7(MySource source) {
        listener = new EventListener() {
            @Override
            public void onEvent(MultiThreadsError5.Event e) {
                System.out.println("\n我得到的数字是" + count);
            }

        };
        for (int i = 0; i < 10000; i++) {
            System.out.print(i);
        }
        count = 100;
    }

    public static MultiThreadsError7 getInstance(MySource source) {
        MultiThreadsError7 safeListener = new MultiThreadsError7(source);
        source.registerListener(safeListener.listener);
        return safeListener;
    }

    public static void main(String[] args) {
        MySource mySource = new MySource();
        new Thread(new Runnable() {
            @Override
            public void run() {
                try {
                    Thread.sleep(10);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                mySource.eventCome(new MultiThreadsError5.Event() {
                });
            }
        }).start();
        MultiThreadsError7 multiThreadsError7 = new MultiThreadsError7(mySource);
    }

    static class MySource {

        private EventListener listener;

        void registerListener(EventListener eventListener) {
            this.listener = eventListener;
        }

        void eventCome(MultiThreadsError5.Event e) {
            if (listener != null) {
                listener.onEvent(e);
            } else {
                System.out.println("还未初始化完毕");
            }
        }

    }

    interface EventListener {

        void onEvent(MultiThreadsError5.Event e);
    }

    interface Event {

    }
}

打印结果:

(3) 在构造函数中新建线程
/**
 *  构造函数中新建线程
 */
public class MultiThreadError6 {
    private Map<String,String> states;

    public MultiThreadError6(){
        new Thread(new Runnable() {
            @Override
            public void run() {
                states=new HashMap<>();
                states.put("1","周一");
                states.put("2","周二");
                states.put("3","周三");
                states.put("4","周四");
                states.put("5","周五");
                states.put("6","周六");
                states.put("7","周七");
            }
        }).start();

    }

    public Map<String,String> getStates(){
        return states;
    }

    public static void main(String[] args) {
        MultiThreadError6 multiThreadError6 = new MultiThreadError6();
        System.out.println(multiThreadError6.states.get("1"));
    }
}

打印结果:

上图所示:出现了空指针的情况 ,因为初始化的操作在另外一个线程中,可能那个线程没有执行完毕,就会出现空指针,假如在 System.out.println(multiThreadError6.states.get("1"));之前 加入 Thread.sleep(1000)休眠一段时间后等另外一个线程执行完,就不会出现这个问题了。

三、总结

1. 各种需要考虑线程安全的情况,如下:

  • 访问共享的变量或资源,会有并发风险,这里的共享变量或资源指的是:对象的属性,静态变量,共享缓存,数据库等等。

  • 所有依赖时序的操作,即可以拆分成多个步骤的操作,即使每一步操作都是线程安全的,但是如果存在操作时序不对,还是存在并发问题,比如:read-modify-write(先读取再修改最后写入)、 check-then-act(先检查再操作)

  • 不同的数据之间存在捆绑关系的时候,那就要么把这些捆绑的数据全部修改,要么都不修改

  • 在使用其他类的时候,如果该类没有声明自己是线程安全的,那就要注意该类可能是线程不安全的

2. 多线程除了安全问题,还可能会导致性能问题:

从某种程度上来讲,多线程可以提高复杂的运算效率,但是一定程度上多线程可能会带来性能提交,比如多线程间的调度和协作带来的性能开销。

(1)调度:上下文切换

线程运行个数超过CPU核心数的时候,CPU就需要对线程进行调度,线程调度中就涉及线程切换,线程的切换的开销是很大的,CPU需要保存当前线程的运行场景,将当前线程的当前运行状态保存好,为载入新的运行线程做准备。这样来来回回其实是很耗费性能的。而引起密集的上下文切换的操作就包括抢锁和IO操作。

(2)协作:内存同步

多个线程之间,针对数据的同步其实大部分是基于 JMM 模型的,这种需要我们后续详细学习并总结,这里只是需要知道,多个线程之间,同步数据也是多线程消耗性能的一个原因。

文章来源:多线程安全的案例展示与解决方案

个人微信:CaiBaoDeCai

微信公众号名称:Java知者

微信公众号 ID: JavaZhiZhe

谢谢关注!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值