volatile是一个特征修饰符(type specifier) volatile的作用是作为指令关键字,确保本条指令不会因编译器的优化而省略,且要求每次直接读值。这是百度百科的介绍,那编译器是具体是怎么优化的呢。
我们知道gcc 是有O0 O1 O2 O3的优化等级的,其中O0优化最低,O3优化最高。
现在看下下面一段简单程序:
#include <stdio.h>
void task_delay(int count)
{
count *= 50000;
while(count--);
}
int main(int argc,char* argv[])
{
printf("Task 0:Created!\n");
printf("Task 0:Running ...\n");
task_delay(1000);
return 0;
}
不用优化编译下:
gcc -g -O0 main.c
看下反汇编代码:
objdump -d a.out
看的出来最低等级的优化-O0 的执行程序task_delay函数的汇编指令非常多,性能损耗长。
现在看下O1的优化后效果:
xc@xc-virtual-machine:~$ gcc -g -O1 main.c
xc@xc-virtual-machine:~$ objdump -d a.out
反汇编代码:
明显task_delay汇编指令比之前-O0优化的时候要少,提升了执行速度。现在在来看下-O3的优化后的反汇编代码
看的出是直接空指令返回的,且运行地址在1180在main函数是没调用,这个暂时不知道怎么回事,交给后面的自己了,哈哈。
好了上面都是准备工作,目的是告诉我们-O3能将程序优化极致。现在我们将count入参用volatile修饰,会怎样,根据百度百科的说法是不会进行优化的,我们测试下:
#include <stdio.h>
void task_delay(volatile int count)
{
count *= 50000;
while(count--);
}
int main(int argc,char* argv[])
{
printf("Task 0:Created!\n");
printf("Task 0:Running ...\n");
task_delay(1000);
return 0;
}
xc@xc-virtual-machine:~$ gcc -g -O3 main.c
xc@xc-virtual-machine:~$
xc@xc-virtual-machine:~$
xc@xc-virtual-machine:~$ objdump -d a.out
发现跟-O0的汇编代码一样,没进行优化。