概述
当多个线程在不同处理器上执行,同时访问相同内存时会存在竞态条件,使用原子操作可以避免竞争。原子操作往往会对总线做一次锁步操作(lock-step),让当前总线上的访存操作能按照次序执行。同时又会刷新Cache,使得任一线程对全局变量使用了原子操作之后,其它所有线程都可见。
使用原子操作做同步开销是相当大的,但是相对于使用更原始的阻塞当前线程执行的同步方式而言又是比较高效的。因此,当对某些特定数据做同步更新时,不需要使用栅栏(fence)等这种更低效的同步处理机制,我们可以直接对那些存储地址采用原子操作。
OpenCL 原子操作
OpenCL 提供了下面一系列原子操作。
原子加/减法
int atomic_add (volatile __global int *p, int val)
在一个原子事务中执行。读取 p 指向位置的内容(用作返回值),将 p 指向位置的内容加上 val 后再存入该位置。
内核在多个设备上对同一内存位置执行的原子操作没法保证原子性。
原子减法操作 atomic_sub
和加法操作类似。