本文分别以gcc O0和O2两个级别进行测试.
有这样一段代码.
#include <unistd.h>
#include <stdio.h>
#include <pthread.h>
static int trigger = 0;
void *thread_dumper(void *arg);
void *thread_worker(void *arg);
int main(int argc, char **argv)
{
pthread_t tid1, tid2;
pthread_create(&tid1, NULL, thread_worker, NULL);
pthread_create(&tid2, NULL, thread_dumper, NULL);
pthread_join(tid1, NULL);
pthread_join(tid2, NULL);
printf("main\n");
return 0;
}
void *thread_dumper(void *arg)
{
while (!trigger)
{
sleep(0);
continue;
}
printf("dumper\n");
return NULL;
}
void *thread_worker(void *arg)
{
int count = 0;
while (count++ < 2)
{
sleep(1);
}
trigger = 1;
printf("worker\n");
return NULL;
}
试问如果去掉dumper中的sleep,编译执行的结果如何?
O0 : 在这个模式下,可以正常执行.
O2 : 这个模式下程序无法正常执行.
这个现象可能很多人都遇到过,我讲一点自己的理解:
这个问题的根本在于 trigger这个全局变量.当优化级别为O2时,编译器判断这个变量为一个寄存器变量,并且初始值为0,就把while ... continue这段优化成了while(1).导致后面程序执行出错.
对于这个问题,我们可能有很多中解决办法.这里说说volatile.
关于这个关键字,大多数说法我都看得云里雾里的,不过那天偶尔听同事的一句解释,倒是很容易理解.就是这个关键字强制使程序每次引用这个变量的时候,都要从新从内存进行读取.而不是用cache里面的.
那么上面这个程序的解法也就比较简单了.把trigger的定义改成static volatile int trigger.问题自然就搞定了.