目录
1、概述
“高效并发”
2、硬件的效率与一致性
计算机的存储设备与处理器的运算速度有几个数量级的差距,所以现代计算机系统都不得不
加入一层读写速度尽可能接近处理器运算速度的高速缓存Cache来作为内存与处理器之间的缓冲:
将运算需要使用到的数据复制到缓存中,让运算能快速进行,当运算结束后再从缓存同步回内存之中,
这样处理器就无须等待缓慢的内存读写了。
基于高速缓存的存储交互很好地解决了处理器与内存的速度矛盾,但是也为计算机系统带来更高的复杂度,因为它引入了一个新的问题:缓存一致性(Cache coherence) 。在多处理器系统中,每个处理器都有自己的高速缓存,而他们又共享同一主内存(Main Memory)。
为了解决一致性问题,需要各个处理器访问缓存时都需要遵循一些协议,在读写时要根据协议来进行操作,这类协议有MSI、MESI、MOSI、Synapse、Firefly及Dragon Protocol等。
除了加入Cache之外,为了使得处理器内部的运算单元能尽量被充分利用,处理器可对输入代码进行乱序执行优化,处理器会在计算之后将乱序执行的结果重组,保证该结果与顺序执行的结果是一致的,但并不保证程序中各个语句计算的先后顺序与输入代码中的顺序一致。
3、Java内存模型
3.1主内存与工作内存
Java内存模型的主要目标是:定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存和从内存中取出变量这样的底层细节。
此处的变量variables包括了实例字段、静态字段和构成数组对象的元素,但不包括局部变量与方法参数,因为后者是线程私有的,不会被共享,自然就不存在竞争的问题。
Java内存模式规定了所有变量都存储在主内存(MainMemory)中。
每条线程都有自己的工作内存(WorkingMemory),线程的工作内存中保存了被该线程使用到的变量的主内存(MainMemory)副本拷贝,线程对变量的所有操作都必须在工作内存(WorkingMemory)中进行,而不能直接读写主内存(MainMemory)中的变量。
不同的线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存(Main Menory)来完成。
3.2内存间交互操作
通过8种内存访问操作以及上述规则限定,在加上volatile的一些特殊规定,就已经完全确定了Java程序中哪些内存访问操作在并发下是安全的。——————由于上述方式比较麻烦,在3.6节介绍一种等效判定原则——先行发生原则。
3.3对于volatile型变量的特殊规则
当一个变量定义为volatile后,将具备两种特性:
①保证此变量对所有线程的可见性,【可见性——当一条线程修改了这个变量的值,新值对于其它线程来说是可以立即得知的。】
由于volatile变量只能保证可见性,在不符合以下两条规则的运算场景中,
仍然要通过加锁(使用synchronized或java.util.concurrent中的原子类)来保证原子性。
①运算结果并不依赖变量的当前值,或者能够确保只有单一的线程修改变量的值。
②变量不需要与其他的状态变量共同参与不变约束。
② 禁止指令重排序优化。————即所谓的“线程内表现为串行的语义”
3.4对于long和double类型的特殊规则
允许虚拟机将没有别volatile修饰的64位数据的读写操作划分为两次32位的操作来执行,即允许虚拟机实现选择可以不保证64位数据类型的load、store、read和write这4个原子操作。
3.5原子性、可见性与有序性
有序性:如果本线程内观察,所有操作都是有序的————“线程内表现为串行的语义”;
如果在一个线程中观察另一个线程,所有的操作都是无序的————“指‘指令重排序’现象和‘工作内存与主内存同步延迟’现象”。
Java语言提供了volatile和synchronized两个关键字来保证线程之间操作的有序性,
volatile关键字本身就包含了禁止指令重排序的语义,
而synchronized则是由“一个变量在同一时刻只允许一个线程对其进行lock操作”这条规则获得的,
这条规则决定了持有同一个锁的两个同步块只能串行地进入。
3.6先行发生原则
Java语言中有一个“先行发生”(happens-before)的原则,它是判断数据是否存在竞争、线程是否安全的主要依据,依靠这个规则,可以通过几条规则解决并发环境下两个操作之间是否可能存在冲突的所有问题。
先行发生是Java内存模型中定义的两项操作之间的偏序关系。
一个操作“时间上的先发生”不代表这个操作会是“先行发生”;如果一个操作“先行发生”不代表这个操作必定是“时间上的先发生”。
4、Java与线程
4.1线程的实现
- 使用内核线程实现
- 内核线程(Kernel-Level Thread,KLT)就是直接由操作系统内核(Kernel,下称内核)支持的线程,这种线程由内核来完成线程切换,内核通过操纵调度器(Scheduler)对线程进行调度,并负责把线程的任务映射到各个处理器上。每个内核线程都可视为内核的一个分身,这样操作系统就有能力同时处理多件事情,支持多线程的内核就叫做多线程内核(Multi-Threads Kernel)。
- 程序一般不会直接去使用内核线程,而是去使用内核线程的一种高级接口————轻量级进程(Light Weight Process,LWP),轻量级进程就是通常意义上的线程。由于每个轻量级进行都由一个内核线程支持,因此只有先支持内核线程,才能有轻量级进程。
- 由于内核线程的支持,每个轻量级进程都称为一个独立的调度单元,即使有一个轻量级进程在系统调用中阻塞了,也不会影响整个进程继续工作。但是其有一定的局限性:
- 由于是基于内核线程实现的,所以各种线程操作,如创建、析构及同步,都需要进行系统调用。而系统调用的代价相对较高,需要在用户态和内核态中来回切换。
- 每个轻量级进程都需要有一个内核线程的支持,因此轻量级进程需要消耗一定的内核资源,因此一个系统支持轻量级进程的数量是有限的
- 使用用户线程实现————使用越来越少
- 狭义上的用户线程指的是完全建立在用户空间的线程库上,系统内核不能感知线程存在的实现。用户线程的建立、同步、销毁和调度完全在用户态中完成,不需要内核的帮助。
- 优势:不需要系统内核支援;
- 劣势:由于没有系统内核的支援,所有的线程操作都需要用户程序自己处理。
- 使用用户线程加轻量级进行混合实现
- 用户线程还是完全建立在用户空间中,因此用户线程的创建、切换、析构等操作依然廉价,并且可以支持多规模的用户线程并发。
- 而操作系统提供支持的轻量级进程则作为用户线程和内核线程之间的桥梁,这样可以使内核提供的线程调度功能及处理器映射,并且用户线程的系统调用要通过轻量级线程来完成,大大降低了这个进程被完全阻塞的风险。
4.2Java线程调度
线程调度是指系统为线程分配处理器使用权的过程,主要调度方式有两种,分别是协同式线程调用和抢占式线程调用。
如果使用协同式调度的多线程系统:
- 线程的执行时间有线程本身来控制,线程把自己的工作执行完了之后,要主动通知系统切换到另外一个线程上。
- 好处:实现简单,没有线程同步问题。
- 坏处:线程执行时间不可控,甚至如果一个线程编写有问题,一直不告诉系统进行线程切换,那么程序就会一直阻塞在那里。
如果使用抢占式调度的多线程系统:
- 每个线程将由系统来分配执行时间,线程的切换不由线程本身来决定。
- 不会有一个线程导致整个进行阻塞的问题,Java使用的线程调度方法就是抢占式调度。