跟我学C++中级篇——内存屏障内存栅栏和编译器屏障以及相关

220 篇文章 28 订阅

一、低级同步常见的技术术语

在一些操作系统或者计算机接口等比较原理化的书籍中,经常提到一些低级的同步术语,或者说一些同步的抽象的说法。最典型的就是内存内存屏障。不同的平台和语言有不同的叫法,有的叫内存栅栏或者屏障指令。它的主要作用就是多线程环境下内存访问的顺序性和可见性即实现在某点的中行化操作。
内存屏障有两大类,一般是内存屏障(或者叫CPU屏障)和编译器屏障。
1、CPU内存屏障
这种屏障一般是在CPU运行时防止指令乱序执行的,还记得前面讲过的happen-before吧,不同层次的处理机制而已。CPU内存屏障的另外一个功能是保证数据的可见性。它的意思就是每一次值的改动,都可以保证被所有相关者看到。这种指令一般都涉及到了机器指令,对上层开发者来说,就是汇编指令,常见的有:
mb() 和 smp_mb():用来保证读写有序
wmb() 和 smp_wmb():写有序
rmb() 和 smp_rmb():读有序

2、编译器屏障
编译器屏障就好理解了,就是对编译器的一种约束,让编译器按要求编译。比如在gcc中有一个定义:

#define barrier() __asm__ __volatile__("": : :"memory")

既然按顺序,就涉及到了前面分析的memory_order,可以结合一起学习。

二、不同平台的应用

内存屏障的应用其实主要和硬件的设计有关系。在CPU的设计中,为了提高读写速度,设计了一大把的缓存机制和指令流水,而缓存机制的出现,特别是多级缓存机制的出现,导致了读写操作的复杂性以及数据一致性和完整性的难度。为了解决这些问题,CPU使用写传播和MESI协议(前面的DPDK中也提到过),目的当然是为了实现数据的安全。其实简单的理解就是在某个阶段实现串行化,而串行化,就保障了数据的安全性。
同样,指令流水也会引起一些优化导致指令重排,大家可以看看相关的书籍和资料。
而在开发过程,代码的编写和编译器对指令的翻译以及内存加载后对指令的处理,并非完全一致。这涉及到编译器和CPU对指令优化执行的一个复杂的过程。或者可以这样理解,房屋的设计图纸,在真正实现时,会在各种规章制度下允许的相关优化的再处理,如原设计的布线不安全不免节省材料,水暖走线交叉等等。但这也带来一个问题,在绝大多数情况下,这是一种好的事情。但在某些情况下,可能会导致一些异常的事情发生,比如CAS的ABA问题。
那么解决问题的一种重要方式就是使用内存屏障,告诉编译器,此处代码不需要优化,照方抓药即可。CAS由于不释放CPU一直在循环等待,所以有的老的版本的资料也把它叫做自旋锁。所以说,它叫无锁编程只是一种叫法,在这方面不要纠结。
在不同的语言中根据这种要求,设计出来了各种锁的机制,原理基本都是一致的,可能细节实现上略有不同,只需要看一下,一般都会明白。

三、例程

c++11中提供了一种内存栅栏的同步机制:

// 全局
std::string computation(int);
void print(std::string);

std::atomic<int> arr[3] = {-1, -1, -1};
std::string data[1000] // 非原子数据

// 线程 A,计算 3 个值
void ThreadA( int v0, int v1, int v2 )
{
//  assert(0 <= v0, v1, v2 < 1000);
    data[v0] = computation(v0);
    data[v1] = computation(v1);
    data[v2] = computation(v2);
    std::atomic_thread_fence(std::memory_order_release);
    std::atomic_store_explicit(&arr[0], v0, std::memory_order_relaxed);
    std::atomic_store_explicit(&arr[1], v1, std::memory_order_relaxed);
    std::atomic_store_explicit(&arr[2], v2, std::memory_order_relaxed);
}

// 线程 B,打印已经计算的 0 与 3 之间的值。
void ThreadB()
{
    int v0 = std::atomic_load_explicit(&arr[0], std::memory_order_relaxed);
    int v1 = std::atomic_load_explicit(&arr[1], std::memory_order_relaxed);
    int v2 = std::atomic_load_explicit(&arr[2], std::memory_order_relaxed);
    std::atomic_thread_fence(std::memory_order_acquire);
//  v0、v1、v2 可能全部或部分结果为 -1。
//  其他情况下读取非原子数据是安全的,因为栅栏:
    if (v0 != -1)
        print(data[v0]);
    if (v1 != -1)
        print(data[v1]);
    if (v2 != -1)
        print(data[v2]);
}

内存栅栏std::atomic_thread_fence与各种锁及同步机制可以达到相同的目的。但二者的不同在于,前者一般用于在无锁编程中,而后者一般用在有锁编程中。

四、总结

有锁和无锁就如武学上的有剑和无剑,重要的不是剑,是一种对内存原理的根本性的理解。不要对一些技术奉为圭臬,因为每一种技术一定有它的长处和短处。也就是常说的应用场景,只有会灵活运用,才是自由的编程。

  • 17
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值