伪共享(False Sharing)产生的来龙去脉

本文探讨了伪共享问题及其对性能的影响。首先介绍了CPU的Cache Memory层次结构,接着讲解了多核环境下缓存一致性协议MESI的工作原理。通过MESI状态的解释,阐述了伪共享如何在不同核心之间导致频繁的缓存失效和数据同步,从而影响程序性能。
摘要由CSDN通过智能技术生成

之前读了一篇美团点评技术博客 2016 年发表的文章:高性能队列——Disruptor,里面提到了 ArrayBlockingQueue会因为加锁和伪共享等出现严重的性能问题。

什么是伪共享呢(False Sharing)呢,讲清楚伪共享出现的原因,我们要先理清楚高速缓存和MESI缓存一致性协议。

Cache Memory

我们都知道 CPU 和主内存之间的运算速度是差异巨大的,在现今的 SMP(Symmetric Multiprocessor)System 中,会在 CPU 和主存间设置三级高速缓存,L1L2L3,读取顺序由先到后。实际上 Cache 的设计是经历过变更的,IntelAMD 的实现细节都不尽相同,本文你可以简单理解为,L1 Cache分为指令缓存和数据缓存两种,L2 Cache只存储数据,L1L2 都是每个核心都有,而 L3 被多核共享。

MESI

那么问题来了,多核CPU的情况下有多个 L1 和 L2 缓存,如何保证缓存内部数据的一

伪共享False Sharing)是指多个线程同时访问不同但位于同一缓存行的变量时,由于缓存一致性协议的限制,会导致缓存行多次在不同的 CPU 之间进行传递,从而降低了程序的性能。 举一个简单的例子:假设两个线程同时访问同一缓存行中的不同变量,如下所示: ``` struct CacheLine { int x; int y; } cacheLine; // 线程 1 void thread1() { while (true) { cacheLine.x++; } } // 线程 2 void thread2() { while (true) { cacheLine.y++; } } ``` 在这个例子中,由于 `x` 和 `y` 位于同一缓存行中,所以在多个线程同时访问它们时,会导致缓存行多次在不同的 CPU 之间进行传递,从而降低了程序的性能。 为了避免伪共享,可以采用以下两种方法: 1. 添加填充:为了让不同的变量位于不同的缓存行中,可以在变量之间添加一些填充,从而让它们位于不同的缓存行中,如下所示: ``` struct CacheLine { int x; char padding[60]; // 填充 int y; } cacheLine; ``` 2. 使用 `std::atomic`:使用 `std::atomic` 可以确保多线程对变量的访问是原子的,从而避免了伪共享的问题,如下所示: ``` struct CacheLine { std::atomic<int> x; std::atomic<int> y; } cacheLine; ``` 以上两种方法都可以有效地避免伪共享的问题,提高程序的性能。但是,需要注意的是,添加填充会增加内存的消耗,而使用 `std::atomic` 会增加程序的开销。因此,需要根据具体的场景选择合适的方法。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值