Linux代码优化和内存屏障(barrier、mb、rmb、wmb)

内存屏障主要解决的问题是编译器的优化和CPU的乱序执行。
编译器在优化的时候,生成的汇编指令可能和c语言程序的执行顺序不一样,在需要程序严格按照c语言顺序执行时,需要显式的告诉编译不需要优化,这在linux下是通过barrier()宏完成的,它依靠volidate关键字和memory关键字,前者告诉编译barrier()周围的指令不要被优化,后者作用是告诉编译器汇编代码会使内存里面的值更改,编译器应使用内存里的新值而非寄存器里保存的老值。
同样,CPU执行会通过乱序以提高性能。汇编里的指令不一定是按照我们看到的顺序执行的。linux中通过mb()系列宏来保证执行的顺序。具体做法是通过mfence/lfence指令(它们是奔4后引进的,早期x86没有)以及x86指令中带有串行特性的指令(这样的指令很多,例如linux中实现时用到的lock指令,I/O指令,操作控制寄存器、系统寄存器、调试寄存器的指令、iret指令等等)。简单的说,如果在程序某处插入了mb()/rmb()/wmb()宏,则宏之前的程序保证比宏之后的程序先执行,从而实现串行化。wmb的实现和barrier()类似,是因为在x86平台上,写内存的操作不会被乱序执行。
实际上在RSIC平台上,这些串行工作都有专门的指令由程序员显式的完成,比如在需要的地方调用串行指令,而不像x86上有这么多隐性的带有串行特性指令(例如lock指令)。所以在risc平台下工作的朋友通常对串行化操作理解的容易些。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
内存屏障是一种机制,用于确保多线程并发访问共享内存时的一致性。在 Linux 内核中,有多种内存屏障的类型和使用方法,其中包括: 1. 读屏障(read barrier):确保所有之前的读操作完成后再进行后续的读操作。 2. 写屏障(write barrier):确保所有之前的写操作完成后再进行后续的写操作。 3. 全屏障(full barrier):确保所有之前的读和写操作都完成后再进行后续的读和写操作。 下面是一个使用内存屏障的示例,假设有两个线程同时访问一个共享变量: ```c #include <stdio.h> #include <pthread.h> #include <stdatomic.h> atomic_int shared_variable = 0; void* thread_function(void* arg) { int i; for (i = 0; i < 1000000; i++) { // 使用内存屏障确保多线程访问的共享变量一致性 atomic_thread_fence(memory_order_seq_cst); shared_variable++; atomic_thread_fence(memory_order_seq_cst); } return NULL; } int main() { pthread_t thread1, thread2; pthread_create(&thread1, NULL, thread_function, NULL); pthread_create(&thread2, NULL, thread_function, NULL); pthread_join(thread1, NULL); pthread_join(thread2, NULL); printf("Shared variable value: %d\n", shared_variable); return 0; } ``` 在这个示例中,每个线程对共享变量执行 1000000 次自增操作。在每次自增操作之前和之后,使用内存屏障确保多线程访问的共享变量一致性。最后,主线程输出共享变量的最终值。 需要注意的是,内存屏障的使用应该根据具体的场景和需求来选择合适的类型和位置。不正确的内存屏障使用可能会导致性能下降或者程序出现错误。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值