set_task_state()底层原理

文章详细介绍了set_task_state和使用mb()函数的区别,以及内存屏障如何通过__asm__和volatile/memory关键字解决编译器优化和CPU乱序执行问题,确保多线程环境下的数据一致性。
摘要由CSDN通过智能技术生成

介绍set_task_state(),mb()以及内存屏障。

#define __set_task_state(tsk, state_value)		\
	do { (tsk)->state = (state_value); } while (0)
#define set_task_state(tsk, state_value)		\
	set_mb((tsk)->state, (state_value))

...

#define set_mb(var, value)  do { var = value;  mb(); } while (0)

...

#define mb()	__asm__ __volatile__ ("" ::: "memory")

语句解释:
1.set_mb(), mb(), barrier()函数追踪到底,就是__asm__ __volatile__("" ::: "memory"),而这行代码就是内存屏障。
2.__asm__:用于指示编译器在此插入汇编语句
3.volatile/__volatile__:基本可以做到两件事情:
  (1).阻止编译器为了提高速度将一个变量缓存到寄存器内而不写回内存。
  (2).阻止编译器调整操作volatile变量的指令顺序。
4.memory强制gcc编译器假设RAM所有内存单元均被汇编指令修改,这样cpu中的registers和cache中已缓存的内存单元中的数据将作废。cpu将不得不在需要的时候重新读取内存中的数据。这就阻止了cpu又将registers,cache中的数据用于去优化指令,而避免去访问内存。 
这是一条无用的汇编指令。可以利用这条无价值的汇编指令来配合lock指令,在__asm__,__volatile__,memory的作用下,用作cpu的内存屏障。 

volatile关键字来让编译器保证变量计算结果写回到内存之中,而没有用volatile关键字约束的变量的计算结果可能保存在寄存器之中,这种限制完全在我们的代码之中控制;语句中的memory强制gcc编译器假设RAM所有内存单元均被汇编指令修改,cpu将不得不在需要的时候重新读取内存中的数据。这两条关键字保证在多线程的环境下数据的一致性。

__set_task_state(tsk, state_value) 这个函数有别于 set_task_state(tsk,state_value) ,因为前者没有使用mb()这样的一个函数,而仅仅是设置了state这个变量值,对于保护内存事件发生的次序根本就没有执行。所以,后者更加具有安全性。

内存屏障主要解决的问题是编译器的优化和CPU的乱序执行。
编译器在优化的时候,生成的汇编指令可能和c语言程序的执行顺序不一样,在需要程序严格按照c语言顺序执行时,需要显式的告诉编译不需要优化,这在linux下是通过barrier()宏完成的,它依靠volidate关键字和memory关键字,前者告诉编译barrier()周围的指令不要被优化,后者作用是告诉编译器汇编代码会使内存里面的值更改,编译器应使用内存里的新值而非寄存器里保存的老值。

同样,CPU执行会通过乱序以提高性能。汇编里的指令不一定是按照我们看到的顺序执行的。linux中通过mb()系列宏来保证执行的顺序。具体做法是通过mfence/lfence指令以及x86指令中带有串行特性的指令(这样的指令很多,例如linux中实现时用到的lock指令,I/O指令,操作控制寄存器、系统寄存器、调试寄存器的指令、iret指令等等)。

简单的说,如果在程序某处插入了mb()/rmb()/wmb()宏,则宏之前的程序保证比宏之后的程序先执行,从而实现串行化。wmb的实现和barrier()类似,是因为在x86平台上,写内存的操作不会被乱序执行。


本文部分参考自网络,如有侵权请私信联系我删除。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值