volatile介绍
volatile
提醒编译器它后面所定义的变量随时都有可能改变,因此编译后的程序每次需要存储或读取这个变量的时候,都会直接从变量地址中读取数据。如果没有volatile
关键字,则编译器可能优化读取和存储,可能暂时使用寄存器中的值,如果这个变量由别的程序更新了的话,将出现不一致的现象。下面举例说明。在DSP(数字信号处理)开发中,经常需要等待某个事件的触发,所以经常会写出这样的程序:
short flag;
void test()
{
do1();
while (flag == 0);
do2();
}
这段程序等待内存变量flag
的值变为1之后才运行do2()
。变量flag
的值由别的程序更改,这个程序可能是某个硬件中断服务程序。例如:如果某个按钮按下的话,就会产生中断,在按键中断程序中修改flag
为1,这样上面的程序就能够得以继续运行。但是,编译器并不知道flag
的值会被别的程序修改,因此在它进行优化的时候,可能会把flag
的值先读入某个寄存器,然后等待那个寄存器变为1。如果不幸进行了这样的优化,那么while循环就变成了死循环,因为寄存器的内容不可能被中断服务程序修改。为了让程序每次都读取真正flag
变量的值,就需要定义为如下形式:
volatile short flag;
需要注意的是,没有volatile
也可能能正常运行,但是可能修改了编译器的优化级别之后就又不能正常运行了。因此经常会出现debug版本正常,但是release版本却不能正常的问题。所以为了安全起见,只要是等待别的程序修改某个变量的话,就加上volatile
关键字。
volatile
的本意是“易变的”,由于访问寄存器的速度要快过RAM,所以编译器一般都会作减少存取外部RAM的优化。比如:
static int i = 0;
int main(void)
{
// ...
while (1){
if (i){
doSomething();
}
}
}
void ISR_2(void)
{
i = 1;
}
程序的本意是希望ISR_2
中断产生时,在main
当中调用do_something
函数,但是,由于编译器判断在main
函数里面没有修改过i,因此可能只执行一次对从i到某寄存器的读操作,然后每次if判断都只使用这个寄存器里面的“i副本”,导致do_something
永远也不会被调用。如果变量加上volatile
修饰,则编译器保证对此变量的读写操作都不会被优化(肯定执行)。此例中i也应该如此说明。
一般说来,volatile
用在如下的几个地方:
- 中断服务程序中修改的供其它程序检测的变量需要加
volatile
; - 多任务环境下各任务间共享的标志应该加
volatile
; - 存储器映射的硬件寄存器通常也要加
volatile
说明,因为每次对它的读写都可能由不同意义。
另外,以上这几种情况经常还要同时考虑数据的完整性(相互关联的几个标志读了一半被打断了重写),在1中可以通过关中断来实现,2中可以禁止任务调度,3中则只能依靠硬件的良好设计了。
关于##
在C中,宏定义使用##相当于连接形成标识符。
# define RESULT(X,Y) X##Y
int main()
{
int userinfo = 40;
// 这一句相当于
// int val = userinfo;
int val = RESULT(user,info);
printf("the result is %d", val);// the result is 40
return 0;
}
__builtin_expect 说明
这个指令是GCC引入的,作用是允许程序员将最有可能的分支告诉编译器,用法是:
__builtin_expect(EXPR, N)
意思为EXPR==N
的概率很大。
一般的使用方法是将其封为likely
和unlikely
两个宏:
#define LIKELY __builtin_expect(!!(x), 1)
#define UNLIKELY __builtin_expect(!!(x), 1)
一般公司代码中会加前缀等,在代码中的用法:
int value = 4;
if (LIKELY(value == 4)){
// process No.1
} else {
// process No.2
}
if (UNLIKELY(value != 4)){
// process No.3
} else {
// process No.4
}
编译器预加载在CPU流水线上的代码就是process No.1
和process No.4
,这样可以避免重新加载流水线。
函数参数个数限制
函数参数个数最好限制在6个。函数调用时,前6个参数通过寄存器传递,超过6个后面的参数通过堆栈传递,而寄存器传递参数比堆栈传递效率高,这样不仅提高了代码可读性,还提高了代码的性能。