c++11--原子操作，顺序一致性，内存模型

raindayinrain

已于 2024-03-21 08:15:06 修改

阅读量1.6k

点赞数 26

分类专栏： 1.3.语言-c++11 文章标签：原子操作顺序一致性内存模型

于 2024-01-01 09:08:19 首次发布

本文链接：https://blog.csdn.net/x13262608581/article/details/135322343

版权

1.3.语言-c++11 专栏收录该内容

9 篇文章

订阅专栏

1.原子操作
多线程下为了实现对临界区资源的互斥访问，最普遍的方式是使用互斥锁保护临界区。
然而，如果临界区资源仅仅是数值类型时，对这些类型c++提供了原子类型，通过使用原子类型可以更简洁的获得互斥保护的支持。

(1). 一个实例

#include <atomic>
#include <thread>
#include <iostream>
using namespace std;

atomic_llong total{0};
void func(int){
    for(long long i = 0; i < 100000; ++i){
        total += i;
    }
}

int main(){
    thread t1(func, 0);
    thread t2(func, 0);
    t1.join();
    t2.join();
    cout << total << endl;
    return 0;
}

上述由于使用了atomic_llong类型的原子变量，所以 total += i;操作是具备互斥保护的。

(2). cstdatomic中的原子类型和内置类型对应表

原子类型名称	对应的内置类型名称
atomic_bool	bool
atomic_char	char
atomic_schar	signed char
atomic_uchar	unsigned char
atomic_int	int
atomic_uint	unsigned int
atomic_short	short
atomic_ushort	unsigned short
atomic_long	long
atomic_ulong	unsigned long
atomic_llong	long long
atomic_ullong	unsigned long long
atomic_char16_t	char16_t
atomic_char32_t	char32_t
atomic_wchar_t	wchar_t

(3).另一种使用原子类型的方式
使用std::atomic<T>模板类。
注意点：
a.该模板类不支持拷贝构造，移动构造，赋值运算符。
b.std::atomic<T>定义了到T的类型转换函数。

(4).atomic类型及其相关的操作

`操作`	`atomic_flag`	`atomic_bool`	`atomic_integral_type`	`atomic<bool>`	`atomic<T*>`	`atomic<integral-type>`	`Atomic<class-type>`
`test_and_set`	`Y`
`clear`	`Y`
`is_lock_free`		`y`	`y`	`y`	`y`	`y`	`y`
`load`		`y`	`y`	`y`	`y`	`y`	`y`
`store`		`y`	`y`	`y`	`y`	`y`	`y`
`exchange`		`y`	`y`	`y`	`y`	`y`	`y`
`compare_exchange_weak+strong`		`y`	`y`	`y`	`y`	`y`	`y`
`fetch_add,+=`			`y`		`y`	`y`
`fetch_sub,-=`			`y`		`y`	`y`
`fetch_or,\|=`		`y`			`y`
`fetch_and,&=`			`y`			`y`
`fetch_xor,^=`			`y`			`y`
`++,--`			`y`		`y`	`y`	`y`

(5).使用atomic_flag可自行实现自旋锁

#include <thread>
#include <atomic>
#include <iostream>
#include <unistd.h>
using namespace std;

std::atomic_flag lock = ATOMIC_FLAG_INIT;
void f(int n){
    while(lock.test_and_set())
        cout << "waiting from thread " << n << endl;
    cout << "thread " << n << " starts working" << endl;
}

void g(int n){
    cout << "thread " << n << " is going to start." << endl;
    lock.clear();
    cout << "thread " << n << " starts working" << endl;
}

int main(){
    lock.test_and_set();
    thread t1(f, 1);
    thread t2(g, 2);
    t1.join();
    usleep(100);
    t2.join();
    return 0;
}

2.顺序一致性，内存模型
默认下，使用原子类型时，自然就是顺序一致的。即，指令实际被cpu执行的顺序，和高级语言中书写顺序是一致的。
有时，对某些并发场景，我们可能并不需要如此严格的限制，也能保证指令执行的正确性，我们可以借助顺序一致性，内存模型的显式控制来达到此目的。

一个实例

#include <thread>
#include <atomic>
#include <iostream>
using namespace std;

atomic<int> a{0};
atomic<int> b{0};
int ValueSet(int){
    int t = 1;
    a = t;
    b = 2;
}

int Observer(int){
    cout << "(" << a << ", " << b << ")" << endl;
}

int main(){
    thread t1(ValueSet, 0);
    thread t2(Observer, 0);
    t1.join();
    t2.join();
    cout << "Got (" << a << ", " << b << ")" << endl;
    return 0;
}

上述实例中线程t1依次对a，b执行赋值。线程t2依次读取a，b的值。
但从高级语言到处理器执行二进制指令的实际效果并不一定严格按上述预期的顺序来。
从高级语言到处理器执行二进制指令有两个阶段会影响指令实际执行的顺序：

(1). 编译阶段
编译器处于性能优化考虑，针对没有执行依赖的语句可能生成汇编代码时调整指令顺序。
上述实例在执行汇编时，线程t1中 int t = 1;a = t;和b = 2;没有依赖关系，所以，允许安排汇编语句时，b = 2;对应的汇编语句在int t = 1;a = t;对应的汇编语句之前或中间。线程t2中访问a，访问b类似。

顺序一致性指的是编译后的汇编指令顺序和高级语言中顺序是否一致。
(2).二进制指令执行阶段
假设编译器按高级语言一致顺序产生了如下汇编代码

1 Loadi reg3, 1; #将立即数1放入寄存器reg3
2 Move reg4, reg3; #将reg3的数据放入reg4
3 Store reg4, a; #将寄存器reg4中的数据存入内存地址a
4 Loadi reg5, 2; #将立即数2放入寄存器reg5
5 Store reg5, b; #将寄存器reg5中的数据存入内存地址b

处理器实际执行二进制指令时由于上述1，2，3和4，5没有依赖关系，所以某些cpu体系结构下，4，5可能在1，2，3之前或1，2，3中间被执行。

这里，我们称严格按二进制指令顺序执行指令的cpu体系结构为强顺序的，反之，则为弱顺序的。
所以，内存模型是一个针对cpu体系结构的概念。

弱顺序体系结构下，保证指令执行顺序符合预期的手段是添加额外的汇编指令。

1 Loadi reg3, 1; #将立即数1放入寄存器reg3
2 Move reg4, reg3; #将reg3的数据放入reg4
3 Store reg4, a; #将寄存器reg4中的数据存入内存地址a
Sync 
4 Loadi reg5, 2; #将立即数2放入寄存器reg5
5 Store reg5, b; #将寄存器reg5中的数据存入内存地址b

由于添加了额外的Sync汇编指令，即使在弱内存cpu体系结构下执行上述汇编指令，也能保证先执行1，2，3再执行4，5。
像Sync这样的汇编指令称为：内存栅栏。

3.高级语言如何保证指令执行顺序和预期（代码中出现顺序）一致
(1).编译阶段保证得到的汇编指令顺序和高级语言中一致。
(2).针对强顺序cpu体系结构，无需额外处理。针对弱顺序cpu体系结构，在汇编指令中额外插入内存栅栏。
默认情况下，使用原子操作时，上述(1)，(2)均是满足的。

4.通过放松一致性要求来提高执行效率
c++的原子操作大多都可以使用memory_order作为一个参数。
c++11中memory_order所有可能取值：

枚举值	定义规则
memory_order_relaxed	不对执行顺序做任何保证
memory_order_acquire	本线程中，所有后续读操作必须在本条原子操作完成后执行
memory_order_release	本线程中，所有之前的写操作完成后才能执行本条原子操作
memory_order_acq_rel	memory_order_acquire + memory_order_release
memory_order_consume	本线程中，所有后续的有关本原子类型的操作，必须在本条原子操作完成后执行
memory_order_seq_cst	全部存取操作都按顺序执行

memory_order_seq_cst 是c++11所有原子操作默认值。具备最强一致性要求。
通常，可把atomic的成员函数可使用的memory_order分为三组：
(1). 原子存储操作（store）
如：memory_order_relaxed 、memory_order_release 、memory_order_seq_cst ．
(2).原子读取操作（load）
如：memory_order_relaxed、memory_order_consume、memory_order_acquire 、memory_order_seq_cst ．
(3).同时读写操作
全部六种

5.利用显式设置memory_order保证原子操作既快又对的实例
5.1.默认版本

#include <thread>
#include <atomic>
#include <iostream>
using namespace std;

atomic<int> a;
atomic<int> b;
int Thread1(int){
    int t = 1;
    a = t;
    b = 2;
}

void Thread2(int){
    while(b != 2);
    cout << a << endl;
}

int main(){
    thread t1(Thread1, 0);
    thread t2(Thread2, 0);
    t1.join();
    t2.join();
    return 0;
}

上述t2种预期打印出来的a应该是1。
原子操作默认下会保证严格的顺序一致性（编译层面，cpu体系执行层面），若我们希望维持预期下，放松一致性要求就需要通过显式设置memory_order来达到目的。

5.2.一个一致性要求略低但保证符合预期的版本

#include <thread>
#include <atomic>
#include <iostream>
using namespace std;

atomic<int> a;
atomic<int> b;
int Thread1(int){
    int t = 1;
    a.store(t, memory_order_relaxed);
    b.store(2, memory_order_release);
}

int Thread2(int){
    while(b.load(memory_order_acquire) != 2);
    cout << a.load(memory_order_relaxed) << endl;
}

int main(){
    thread t1(Thread1, 0);
    thread t2(Thread2, 0);
    t1.join();
    t2.join();
    return 0;
}

t1中memory_order_release会保证a的写入先执行，再执行b的写入。
t2中memory_order_acquire会保证先读取b，再读取a。
上述两个限制下，我们知道t2中a将会符合预期。