1 可见性、原子性和有序性问题
缓存导致的可见性问题:
单核时代所有的线程都在一颗CPU上执行,CPU缓存与内存一致性容易解决。所有线程都操作同一颗CPU的缓存,一个线程对缓存的写,对另一个线程来说是可见的。一个线程对共享变量的修改,另一个线程立马可见,这就是可见性。
多核时代每个CPU都有自己的缓存,多个线程在不同的CPU上执行时,这些线程操作的是不同的CPU缓存,这时线程之间的变量就不具备可见性了。
public class Test {
private long count = 0;
private void add10K() {
int idx = 0;
while(idx++ < 10000) {
count += 1;
}
}
public static long calc() {
final Test test = new Test();
// 创建两个线程,执行 add() 操作
Thread th1 = new Thread(()->{
test.add10K();
});
Thread th2 = new Thread(()->{
test.add10K();
});
// 启动两个线程
th1.start();
th2.start();
// 等待两个线程执行结束
th1.join();
th2.join();
return count;
}
}
如上代码,两个线程去调用add方法。我们假设线程 A 和线程 B 同时开始执行,那么第一次都会将 count=0 读到各自的 CPU 缓存里,执行完 count+=1 之后,各自 CPU 缓存里的值都是 1,同时写入内存后,我们会发现内存中是 1,而不是我们期望的 2。之后由于各自的 CPU 缓存里都有了 count 的值,两个线程都是基于 CPU 缓存里的 count 值来计算,所以导致最终 count 的值都是小于 20000 的。这就是缓存的可见性问题。
线程切换带来的原子性问题:
一个或者多个操作在CPU执行过程中不会被中断的特性是原子性。
在一个时间片内,一个线程进行IO操作,他可以把自己标记为休眠状态,并让出CPU的使用权给其他线程使用,接着操作系统会把这个休眠的线程唤醒,唤醒后的线程重新拥有CPU的使用权。线程在进行等待IO时会释放CPU的使用权,是为了让CPU在线程等待的过程中提供给其他线程使用,提高CPU的利用率。
早起的操作系统是基于进程来调度CPU的,不同进程间是不共享内存空间的,进程要做任务切换就要切换内存映射地址。但是线程里创建的所有线程都是共享同一个内存空间的,所以线程做切换成本较低。现在的操作系统都是基于线程来调度。
编译优化带来的有序性问题
有序性指的是程序按照代码的先后顺序执行,编译器为了优化性能,有时候会改变程序中语句的先后顺序,虽然调整了顺序但是不影响程序的最终结果。但是有时候会出现意想不到的BUG。
一个经典的例子:双重检查创建单例对象。
public class Singleton {
static Singleton instance;
static Singleton getInstance(){
if (instance == null) {
synchronized(Singleton.class) {
if (instance == null)
instance = new Singleton();
}
}
return instance;
}
}
两个线程同时调用如上singleton方法。完美的情况是,线程AB同时调用getInstance方法,他们会发现instance==null,然后synchronized加锁,保证只有一个线程加锁成功。线程A创建实例,然后释放锁,接着唤醒线程B,B加锁进入临界资源,发现有对象存在了,直接返回instance实例。
如上是最好的情况,但是如果发生了编译器重排序,比如
1 分配了一块内存M; 2 在内存M上初始化Singleton对象; 3 然后M的地址赋值给instance变量。
但是实际情况是 1 分配了一块内存M; 2 然后M的地址赋值给instance变量; 3 在内存M上初始化Singleton对象;
线程A先去执行getInstance方法,当完成上面指令2时发生线程切换,线程B也执行getInstance方法,线程B执行第一个instance == null时发现instance !=null。直接返回了instance。但是此时instance并没有初始化过,此时访问instance就会触发空指针异常。