C++ <atomic>汇编语言实现原理

最新推荐文章于 2024-05-09 21:25:10 发布

王行知

最新推荐文章于 2024-05-09 21:25:10 发布

阅读量348

点赞数 3

文章标签： c++ 算法 linux 开发语言运维

本文链接：https://blog.csdn.net/qq_44151291/article/details/137283024

版权

C++ <atomic>汇编语言实现原理

问题

我们先看一下这段代码：

/* 
 * badcnt.c - An improperly synchronized counter program 
 */
/* $begin badcnt */
/* WARNING: This code is buggy! */
#include "csapp.h"

void *thread(void *vargp);  /* Thread routine prototype */

/* Global shared variable */
volatile long cnt = 0; /* Counter */

int main(int argc, char **argv) 
{
    long niters;
    pthread_t tid1, tid2;

    niters = 100000;

    /* Create threads and wait for them to finish */
    Pthread_create(&tid1, NULL, thread, &niters);
    Pthread_create(&tid2, NULL, thread, &niters);
    Pthread_join(tid1, NULL);
    Pthread_join(tid2, NULL);

    /* Check result */
    if (cnt != (2 * 100000))
	printf("BOOM! cnt=%ld\n", cnt);
    else
	printf("OK cnt=%ld\n", cnt);
    exit(0);
}

/* Thread routine */
void *thread(void *vargp) 
{
    long i, niters = *((long *)vargp);

    for (i = 0; i < niters; i++) //line:conc:badcnt:beginloop
	    cnt++;                   //line:conc:badcnt:endloop

    return NULL;
}
/* $end badcnt */

这段代码创建了两个线程，每个线程都对cnt全局变量执行100000次++操作，所以我们的得到的cnt应该是200000，但是结果却并不是这样：

很奇怪啊，两个线程都对cnt执行++操作，怎么比200000要小啊，而且每次结果都不一样。

其实从汇编语言(指令)的角度去理解这个，就能解释这个问题。将cnt++翻译成对应的汇编指令，是这样：

movq cnt(%rip), %rdx // 加载cnt
addq $1, %rdx // 更新cnt
movq %rdx, cnt(%rip) // 写回cnt

我们知道，指令才是cpu上执行的最小单位(可以把一条指令的执行理解成不可中断的)，我们可以发现，如果一个进程在更新cnt之后，还没有写回，但是此时另一个进程已经读取了cnt，是不是就出问题了！就比如此时cnt是1，一个进程取出来了进行加1，得到2，但是还没有写回，但是另一个进程此时正在执行第一条指令，这样就出问题了。所以这是导致cnt结果不符合期待的原因。

解决方案

C++给我们提供了原子操作： atomic<int> cnt;这个时候对cnt进行算数运算，就是正确的。宏观意义上就是对a进行的操作是原子的，但是atomic的是怎么实现的呢？这里一位面试官问过我，把我问住了，我当时回答的是给指令加锁，保证上面三行汇编指令不会被打断。但其实这样是错误的，或者说效率很低的，有可能需要引入额外的硬件机制。其实x86-64处理器提供了一个汇编指令帮助编译器实现atomic。

也就是 CMPXCHG (compare and exchange)：

在执行CMPXCHG之前，先在EAX中存储了旧值，

这个指令的功能是这样的：

比较：CMPXCHG 首先将目标内存位置的值与 EAX 或 RAX中的旧值进行比较。
交换：如果目标内存位置的值与寄存器中的值相等(即比较结果为相等)，CMPXCHG 会将另一个指定寄存器的值写入目标内存位置。如果不相等，CMPXCHG 将目标内存位置的值加载到那个寄存器中。

这个指令的基本形式如下：
CMPXCHG 目标位置(与eax比较), source

我在这里说一下实现原子操作的思路：在执行累加之前，首先把cnt的旧值存储到eax中，然后再去读取这个值，并执行运算得到source值，此时就会执行CMPXCHG了，如果旧值和目标位置值相等，就写入，这个写入是不可中断的(应该是CMPXCHG内部的实现)，如果不相等，就把目标内存的值加载到eax中的值就会被更新为内存中的新值，再重新执行算数操作，然后重复这个过程。

王行知

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
C++ <atomic>汇编语言实现原理

C++ <atomic>汇编语言实现原理问题我们先看一下这段代码：/* * badcnt.c - An improperly synchronized counter program *//* $begin badcnt *//* WARNING: This code is buggy! */#include "csapp.h"void *thread(voi...
复制链接

扫一扫