Compare-and-Swap 和 Read-Modify-Write

最新推荐文章于 2024-03-27 10:02:42 发布

andyleung520

最新推荐文章于 2024-03-27 10:02:42 发布

阅读量375

点赞数

分类专栏： C++ 笔记文章标签： c++

本文链接：https://blog.csdn.net/Kiris_king/article/details/131710505

版权

C++ 同时被 2 个专栏收录

61 篇文章 1 订阅

订阅专栏

笔记

11 篇文章 0 订阅

订阅专栏

原子的read-modify-write操作——简称RMW——要比原子的load/store更复杂。

RMW允许读一块共享数据的同时还原地修改它的值。C++11的atomic库中的下列函数都属于RMW操作：

std::atomic<>::fetch_add()
std::atomic<>::fetch_sub()
std::atomic<>::fetch_and()
std::atomic<>::fetch_or()
std::atomic<>::fetch_xor()
std::atomic<>::exchange()
std::atomic<>::compare_exchange_strong()
std::atomic<>::compare_exchange_weak()

以fetch_add为例，它首先读取一个共享变量的当前值，对这个值做加法，再将新的值写回去——这3步是原子完成的。你可以用锁来完成同样的操作，但这就不是无锁的了。而RMW操作则天生就被设计为是无锁的。RMW操作可以受益于任何CPU的无锁指令，如ARMv7的ldrex/strex。

初学者看完上面的函数列表后可能会问：“为什么C++11只提供了这么少的RMW操作？为什么有fetch_add却没有fetch_multiply、fetch_divide或fetch_shift_left？”

原因有两点：

实践中对这几个RMW操作的需求非常少。不要对RMW的使用方式产生错误的印象，将一个单线程算法中每一步都换成RMW操作是得不到多线程安全的代码的。

这些操作实现起来很简单，需要的时候自己实现一下就好。就像本文标题说的，你可以做任何RMW操作！

Compare-and-Swap：所有RMW操作的基础

C++11所有可用的RMW操作之中，最基础的就是compare_exchange_weak，其它的RMW操作都是用它实现的。compare_exchange_weak 最少需要两个参数：

shared.compare_exchange_weak(T& expected, T desired, ...);

它会在shared的当前值与expected相等时将shared替换为desired。
如果替换成功，返回true；
如果失败，它会将shared的当前值保存到expected中——无视expected的名字，它其实是一个in/out参数。

以上过程被称为compare-and-swap操作，整个过程就是一次原子操作。

uint32_t fetch_multiply(std::atomic<uint32_t>& shared, uint32_t multiplier)
{
    uint32_t oldValue = shared.load();
    while (!shared.compare_exchange_weak(oldValue, oldValue * multiplier))
    {
    }
    return oldValue;
}

上面这个循环被称为compare-and-swap循环，或CAS循环。

函数里反复尝试将oldValue替换为oldValue * multiplier，直至替换成功。如果没有其它线程同时也在做修改，compare_exchange_weak一般第一次尝试就会成功。

另一方面，如果有其它线程同时在修改shared，它的值就有可能在load和compare_exchange_weak之间被改变，就会导致CAS操作失败。这种情况下oldValue会更新为shared的最新值，循环继续。

上面的fetch_multiply既是原子的，又是无锁的。
原子性是因为：尽管CAS循环可能会重复不确定次，但最后的修改动作是原子的。
无锁是因为：如果CAS循环的某次迭代失败了，往往是由于另一个线程修改成功了。

最后这个结论取决于一个假设：compare_exchange_weak会被编译为无锁的机器码——细节见下文。它也忽略了一个事实：在某些平台上compare_exchange_weak可能会假失败，但这种情况很罕见，不需要考虑使用锁的算法。

多个步骤组合为一次RMW

uint32_t atomicDecrementOrHalveWithLimit(std::atomic<uint32_t>& shared)
{
    uint32_t oldValue = shared.load();
    uint32_t newValue;
    do
    {
        if (oldValue % 2 == 1)
            newValue = oldValue - 1;
        else
            newValue = oldValue / 2;
        if (newValue < 10)
            break;
    }
    while (!shared.compare_exchange_weak(oldValue, newValue));
    return oldValue;
}

思路和上节一样：如果compare_exchange_weak失败——通常是因为其它线程的并发修改——就将oldValue更新为最新值，再重试。如果中间某步我们发现newValue小于10，就提前结束循环。

重点是你可以在CAS循环中放任何操作。想像CAS循环体就是一段临界区。通常我们用mutex来保护临界区，而在CAS循环中我们只是简单的重试整个事务，直到成功。

上面只是一个生造的例子。一个更实际的例子见我在关于信号量的早期文章中描述的AutoResetEvent类。它用了包含多步的CAS循环将一个共享变量自增至1。

将多个变量组合为一次RMW

说了这么多，我们只看到了如何对一个共享变量进行原子操作。怎么用一个原子操作修改多个变量？一般我们都用mutex来保护

std::mutex mutex;
uint32_t x;
uint32_t y;

void atomicFibonacciStep()
{
    std::lock_guard<std::mutex> lock(mutex);
    int t = y;
    y = x + y;
    x = t;
}
//std::atomic<>是一个模板，
//所以我们可以将两个变量打包为一个struct，再应用之前的模式：

struct Terms
{
    uint32_t x;
    uint32_t y;
};

std::atomic<Terms> terms;

void atomicFibonacciStep()
{
    Terms oldTerms = terms.load();
    Terms newTerms;
    do
    {
        newTerms.x = oldTerms.y;
        newTerms.y = oldTerms.x + oldTerms.y;
    }
    while (!terms.compare_exchange_weak(oldTerms, newTerms));
}

一般而言，C++11标准没有承诺原子操作是无锁的。编译器要支持太多的CPU架构，而且有太多实例化std::atomic<>模板的方法了。你需要检查你的编译器来确认这件事。但在实践中如果下面的条件都满足，你可以放心假设原子操作就是无锁的.

一些将多个值打包为一个原子位域的真实例子：
实现带tag的指针来绕过ABA问题。
实现一种轻量的读写锁。

一般来说，如果你需要用mutex保护少量的几个变量，且这几个变量可以打包成32或64位整数，你就可以将基于mutex的代码改写成基于无锁的RMW操作，无论这些RMW操作底层是如何实现的！我之前在信号量是如此的通用中为了实现一组轻量的同步原语，曾充分利用了这一原则。

当然这种技术不只适用于C++11的atomic库。上文的例子都使用C++11的atomic是因为它已经被广泛使用了，而且编译器的支持也非常好。你可以基于任何提供了CAS的库实现自己的RMW操作，例如Win32、March kernel API、Linux kernel API、GCC atomic扩展或Mintomic。简洁起见，我没有讨论内存顺序，但一定要去考虑你的atomic库提供了怎样的顺序保证。尤其是，如果你自己写的RMW操作是要在线程间传递非atomic的信息，那至少你要保证它与某种同步关系是等价的。

andyleung520

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Compare-and-Swap 和 Read-Modify-Write

原子的read-modify-write操作——简称RMW——要比原子的load/store更复杂。RMW允许读一块共享数据的同时还原地修改它的值。以fetch_add为例，它首先读取一个共享变量的当前值，对这个值做加法，再将新的值写回去——这3步是原子完成的。你可以用锁来完成同样的操作，但这就不是无锁的了。而RMW操作则天生就被设计为是无锁的。RMW操作可以受益于任何CPU的无锁指令，如ARMv7的ldrex/strex。
复制链接

扫一扫