CPU部分定义及内存模型
- 内存屏障:memory barriers, 一组处理器指令,用来实现对内存操作的顺序限制。
- 缓存行:cahce line, CPU高速缓存中可以分配的最小存储单元,处理器填写缓存行时会加载整个缓存行。目前常用处理器的缓存行为64字节,例如Java 中一个long 类型的变量为8个字节,则在一个缓存行中可以缓存8个long类型的变量。
- 原子操作:atomic operations, 不可中断的一个或一系列操作。
- 缓存行填充:cache line fill, 以一个缓存行为单位读取到缓存中。例如访问一个long 数组中的某个值,该值被加载到缓存中时,会额外将其连续的另外7个值同时加载到缓存中,所以数组遍历较快。不过这也有缺点,后面提及。
- 缓存命中:cache hit, 处理器访问的地址已经存在在高速缓存中,则从缓存中读取,而不是内存。
- 写命中:write hit, 处理器写回操作数时,首先检查是否存在缓存中,如果在,将其写回缓存,而不是内存。
volatile 的实现原理及应用
volatile 可看做是轻量级的synchronized,它在多处理器开发中保证了共享变量的可见性,所谓可见性是指当一个线程修改一个共享变量时,其他线程可以读到正确的已被修改的值。
缓存一致性原理: 为了提高处理速度,处理器不会直接和内存进行通信,而是将内存中的数据读到缓存中,进行写操作时也优先写回缓存中,就会出现多个处理器中缓存不一致的情况。如果对声明了volatile 关键字的变量进行写操作,JVM 会向处理器发送一条Lock 前缀的指令,然后将这个变量所在缓存行的数据写回到主存中。每个处理器通过嗅探在总线上传播的数据,检查自己缓存中的值是否过期,如果过期,将当前处理器的该缓存行设置为无效,下次进行操作时重新进行缓存行填充。
应用优化: 缓存行填充的额外加载在这里可能会成为负担,例如在一个缓存行中缓存了A和B两个变量,一个内核中线程的操作修改了A的值,另一个内核中线程只是想读B的值,但是该内核中该缓存行已被设为无效状态,不得不从主内存中重新进行缓存行填充,哪怕A和B没有丁点儿关系。
优化的方法就是将共享变量追加到64字节,使其独占一个缓存行,缓存锁定只会锁定该变量,且不会影响其他变量的缓存状态。
synchronized 的实现原理及应用
- 对于普通同步方法,锁的是当前实例对象。
- 对于静态同步方法,锁的是当前类的Class对象。
- 对于同步方法块,锁的是synchronized括号里配置的对象。
以HotSpot 虚拟机为例,对象在堆内存中的存储布局可分为三个部分:对象头(Header)、实例数据(Instance Data)、对齐填充(Padding)。
- 实例字段部分存储了对象的有效信息,即各种字段内容。
- 对齐填充仅是占位符的功能,虚拟机要求对象的起始地址为8字节的整数倍,所以任何对象的大小都是8字节的整数倍。
synchronized 用的锁存储在Java对象头中。如果对象是数组类型,虚拟机用3个字宽(1个字宽为4个字节)存储对象头;如果非数组,则用2个字宽存储。
长度 | 内容 | 说明 |
---|---|---|
32/64bit | Mark Word | 存储对象的hashCode和锁信息 |
32/64bit | Class Metadata Address | 存储到对象类型数据的指针 |
32/32bit | Array length | 如果当前对象是数组,数组长度 |
无锁时,Mark Word 的存储结构是
锁状态 | 25bit | 4bit | 1bit 是否偏向锁 | 2bit 锁标志 |
---|---|---|---|---|
无锁 | 对象的hashCode | 对象分代年龄 | 0 | 01 |
偏向锁时,Mark Word 的存储结构是
锁状态 | 25bit | 4bit | 1bit 是否偏向锁 | 2bit 锁标志 |
---|---|---|---|---|
偏向锁 | 线程ID | 对象分代年龄 | 1 | 01 |
大多数情况下,锁不仅不存在多线程竞争,而且总是由同一线程多次获得,为了让线程获得锁的代价更低,引入偏向锁。
当一个线程获取锁时,会在对象头中记录锁偏向的线程ID,以后该线程进出该同步代码块时,不需要通过CAS 操作进行加锁和解锁,只需要查看对象头的Mark Word 里是否存储当前线程的线程ID,如果有,则获得锁;如果没有,再查看Mark Word 偏向锁的标识是否为1,如果是,尝试使用CAS 将对象头的线程ID指向当前线程;如果不是,使用CAS 竞争锁。
轻量级锁时,Mark Word 的存储结构是
锁状态 | 2bit 锁标志 | |
---|---|---|
轻量级锁 | 指向栈中锁记录的指针 | 00 |
线程在执行同步块之前,JVM 在当前线程的栈帧中创建用来存储所记录的空间,并将对象头中的Mark Word 复制到锁记录中,这个记录称为Displayed Mark Word, 然后线程尝试使用CAS 将对象头中的Mark Word 替换为指向锁记录的指针,如果成功,则表明该线程获得锁。
轻量级锁解锁时,尝试用CAS 操作将Display Mark Word 替换回对象头中去,如果成功,无竞争;如果失败,表示存在竞争,锁会膨胀成重量级锁。
CAS 操作
CAS:Compare and Swap, 比较并交换。CAS 操作需要输入两个值,一个旧值和一个新值,旧值指的是期望操作前的数值,在操作前先比较旧值和内存中的值是否相等,如果相等的话更新为新值。
- ABA 问题:如果一个值原来是A,变成了B,又变成了A,那么使用CAS 检查时就会发现好像没有改变,解决思路是使用版本号,A->B->C 变成了 1A->2B->3C。