两个示例函数,循环对一个全局变量(c和d)进行累加计算,其中变量c有volatile关键字修饰,变量c没有。使用gcc O2优化编译后,使用objdump导出汇编。
从汇编代码看出,add函数被编译优化,内存变量d首先被放到了寄存器EAX,后续所有的累加操作,都是对EAX中值的累加,循环计算完成后,最后EAX结果写入内存变量d()。
addx函数没有被优化,循环中每一次累加前从内存变量c读取写入EAX,计算后再都被写入内存变量c(11c0),再从内存变量C读出放入EAX,做下一步循环计算。
两者比较之下,add对内存变量d的读写各只有1次,addx则在每次循环都有一次对变量c的读写操作,显然addx的性能会因此差很多。
但在多线程程序中,在循环累加的过程中,如果有另一个线程读取变量c和d,那么对于c变量可以获取到每一步循环的累加的中间值。而对于变量d,只会获取到初始值,直到add循环结束后才能获取到最终结果。
因此,在多线程并发程序中,共享变量最好加上volatile,特别是