Atomic 和 Unsafe

原子操作
原子(atom)本意是“不能被进一步分割的最小粒子”,而原子操作(atomic
operation)意为”不可被中断的一个或一系列操作” 。在多处理器上实现原子操作就变得
有点复杂。本文让我们一起来聊一聊在Inter处理器和Java里是如何实现原子操作的。
1、相关术语
术语名称 英文
缓存行 Cache line
比较并交换 Compare and Swap
CPU流水线 CPU pipeline
内存顺序冲突 Memory order violation
2、处理器如何实现原子操作
32位IA-32处理器使用基于对缓存加锁或总线加锁的方式来实现多处理器之间的原子操
作。
2.1   处理器自动保证基本内存操作的原子性
首先处理器会自动保证基本的内存操作的原子性。处理器保证从系统内存当中读取或者
写入一个字节是原子的,意思是当一个处理器读取一个字节时,其他处理器不能访问这个字
节的内存地址。奔腾6和最新的处理器能自动保证单处理器对同一个缓存行里进行16/32/64
位的操作是原子的,但是复杂的内存操作处理器不能自动保证其原子性,比如跨总线宽度,
跨多个缓存行,跨页表的访问。但是处理器提供总线锁定和缓存锁定两个机制来保证复杂内
存操作的原子性。
2.2   使用总线锁保证原子性
第一个机制是通过总线锁保证原子性。如果多个处理器同时对共享变量进行读改写
(i++就是经典的读改写操作)操作,那么共享变量就会被多个处理器同时进行操作,这样
读改写操作就不是原子的,操作完之后共享变量的值会和期望的不一致,举个例子:如果
i=1,我们进行两次i++操作,我们期望的结果是3,但是有可能结果是2。如下图
原因是有可能多个处理器同时从各自的缓存中读取变量i,分别进行加一操作,然后分
别写入系统内存当中。那么想要保证读改写共享变量的操作是原子的,就必须保证CPU1读
改写共享变量的时候,CPU2不能操作缓存了该共享变量内存地址的缓存。
处理器使用总线锁就是来解决这个问题的。所谓总线锁就是使用处理器提供的一个
LOCK#信号,当一个处理器在总线上输出此信号时,其他处理器的请求将被阻塞住,那么该
处理器可以独占使用共享内存。
2.3 使用缓存锁保证原子性
第二个机制是通过缓存锁定保证原子性。在同一时刻我们只需保证对某个内存地址的操
作是原子性即可,但总线锁定把CPU和内存之间通信锁住了,这使得锁定期间,其他处理器
不能操作其他内存地址的数据,所以总线锁定的开销比较大,最近的处理器在某些场合下使
用缓存锁定代替总线锁定来进行优化。
频繁使用的内存会缓存在处理器的L1,L2和L3高速缓存里,那么原子操作就可以直接
在处理器内部缓存中进行,并不需要声明总线锁,在奔腾6和最近的处理器中可以使用“缓
存锁定”的方式来实现复杂的原子性。所谓“缓存锁定”就是如果缓存在处理器缓存行中内
存区域在LOCK操作期间被锁定,当它执行锁操作回写内存时,处理器不在总线上声言
LOCK#信号,而是修改内部的内存地址,并允许它的缓存一致性机制来保证操作的原子
性,因为缓存一致性机制会阻止同时修改被两个以上处理器缓存的内存区域数据,当其他处
理器回写已被锁定的缓存行的数据时会起缓存行无效,在例1中,当CPU1修改缓存行中的i
时使用缓存锁定,那么CPU2就不能同时缓存了i的缓存行。
但是有两种情况下处理器不会使用缓存锁定。第一种情况是:当操作的数据不能被缓存
在处理器内部,或操作的数据跨多个缓存行(cache line),则处理器会调用总线锁定。第
二种情况是:有些处理器不支持缓存锁定。对于Inter486和奔腾处理器,就算锁定的内存区
域在处理器的缓存行中也会调用总线锁定。
以上两个机制我们可以通过Inter处理器提供了很多LOCK前缀的指令来实现。比如位测
试和修改指令BTS,BTR,BTC,交换指令XADD,CMPXCHG和其他一些操作数和逻辑指
令,比如ADD(加),OR(或)等,被这些指令操作的内存区域就会加锁,导致其他处理
器不能同时访问它。
2.4Java当中如何实现原子操作
在java中可以通过锁和循环CAS的方式来实现原子操作。
JVM中的CAS操作正是利用了上文中提到的处理器提供的CMPXCHG指令实现的。自
旋CAS实现的基本思路就是循环进行CAS操作直到成功为止,具体的类可以参见juc下的
atomic包内的原子类。

 

 

Atomic
在Atomic包里一共有12个类,四种原子更新方式,分别是原子更新基本类型,原子更
新数组,原子更新引用和原子更新字段。Atomic包里的类基本都是使用Unsafe实现的包装
类。
基本类:AtomicInteger、AtomicLong、AtomicBoolean;
引用类型:AtomicReference、AtomicReference的ABA实例、
AtomicStampedRerence、AtomicMarkableReference;
数组类型:AtomicIntegerArray、AtomicLongArray、AtomicReferenceArray
属性原子修改器(Updater):AtomicIntegerFieldUpdater、
AtomicLongFieldUpdater、AtomicReferenceFieldUpdater

 

1、原子更新基本类型类
用于通过原子的方式更新基本类型,Atomic包提供了以下三个类:
AtomicBoolean:原子更新布尔类型。
AtomicInteger:原子更新整型。
AtomicLong:原子更新长整型。
AtomicInteger的常用方法如下:
int addAndGet(int delta) :以原子方式将输入的数值与实例中的值
(AtomicInteger里的value)相加,并返回结果
boolean compareAndSet(int expect, int update) :如果输入的数值等于预期
值,则以原子方式将该值设置为输入的值。
int getAndIncrement():以原子方式将当前值加1,注意:这里返回的是自增
前的值。
void lazySet(int newValue):最终会设置成newValue,使用lazySet设置值
后,可能导致其他线程在之后的一小段时间内还是可以读到旧的值。
int getAndSet(int newValue):以原子方式设置为newValue的值,并返回旧
值。
Atomic包提供了三种基本类型的原子更新,但是Java的基本类型里还有char,float和

double等。那么问题来了,如何原子的更新其他的基本类型呢?Atomic包里的类基本都是
使用Unsafe实现的,Unsafe只提供了三种CAS方法,compareAndSwapObject,
compareAndSwapInt和compareAndSwapLong,再看AtomicBoolean源码,发现其是
先把Boolean转换成整型,再使用compareAndSwapInt进行CAS,所以原子更新double
也可以用类似的思路来实现。

2、原子更新数组类
通过原子的方式更新数组里的某个元素,Atomic包提供了以下三个类:
AtomicIntegerArray:原子更新整型数组里的元素。
AtomicLongArray:原子更新长整型数组里的元素。
AtomicReferenceArray:原子更新引用类型数组里的元素。
AtomicIntegerArray类主要是提供原子的方式更新数组里的整型,其常用方法如下
int addAndGet(int i, int delta):以原子方式将输入值与数组中索引i的元素相
加。
boolean compareAndSet(int i, int expect, int update):如果当前值等于预期
值,则以原子方式将数组位置i的元素设置成update值。

3、原子更新引用类型
原子更新基本类型的AtomicInteger,只能更新一个变量,如果要原子的更新多个变
量,就需要使用这个原子更新引用类型提供的类。Atomic包提供了以下三个类:
AtomicReference:原子更新引用类型。
AtomicReferenceFieldUpdater:原子更新引用类型里的字段。
AtomicMarkableReference:原子更新带有标记位的引用类型。可以原子的更
新一个布尔类型的标记位和引用类型。构造方法是AtomicMarkableReference(V
initialRef, boolean initialMark)。

4、原子更新字段类
如果我们只需要某个类里的某个字段,那么就需要使用原子更新字段类,Atomic包提
供了以下三个类:
AtomicIntegerFieldUpdater:原子更新整型的字段的更新器。
AtomicLongFieldUpdater:原子更新长整型字段的更新器。
AtomicStampedReference:原子更新带有版本号的引用类型。该类将整数值
与引用关联起来,可用于原子的更数据和数据的版本号,可以解决使用CAS进行原子
更新时,可能出现的ABA问题。
原子更新字段类都是抽象类,每次使用都时候必须使用静态方法newUpdater创建一个
更新器。原子更新类的字段的必须使用public volatile修饰符。

Unsafe功能介绍
Unsafe提供的API大致可分为内存操作、CAS、Class相关、对象操作、线程调度、系
统信息获取、内存屏障、数组操作等几类,下面将对其相关方法和应用场景进行详细
介绍。

1、内存操作
这部分主要包含堆外内存的分配、拷贝、释放、给定地址值操作等方法。
//分配内存, 相当于C++的malloc函数
public native long allocateMemory(long bytes);
//扩充内存
public native long reallocateMemory(long address, long bytes);
//释放内存
public native void freeMemory(long address);
//在给定的内存块中设置值
public native void setMemory(Object o, long offset, long bytes,
byte value);
//内存拷贝
public native void copyMemory(Object srcBase, long srcOffset,
Object destBase, long destOffset, long bytes);
//获取给定地址值,忽略修饰限定符的访问限制。与此类似操作还有: getInt,
getDouble,getLong,getChar等
public native Object getObject(Object o, long offset);
//为给定地址设置值,忽略修饰限定符的访问限制,与此类似操作还有:
putInt,putDouble,putLong,putChar等
public native void putObject(Object o, long offset, Object x);
public native byte getByte(long address);
//为给定地址设置byte类型的值(当且仅当该内存地址为
allocateMemory分配  时,此方法结果才是确定的)
public native void putByte(long address, byte x);

通常,我们在Java中创建的对象都处于堆内内存(heap)中,堆内内存是由JVM
所管控的Java进程内存,并且它们遵循JVM的内存管理机制,JVM会采用垃圾回收机
制统一管理堆内存。与之相对的是堆外内存,存在于JVM管控之外的内存区域,Java
中对堆外内存的操作,依赖于Unsafe提供的操作堆外内存的native方法。

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

执于代码

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值