在编译器的优化选项设置为“-O0”,即不优化时:
void DelayMs(int n)
{
int i, loops = SystemSYSCLKGet() / 12000;
for( ; n > 0; n--)
for(i = 0; i < loops; i++) ;
}
这意味着:最内层的for语句,执行一次循环需要12个CPU时钟周期。反汇编如下图:
在编译器的优化选项设置为“-O2”时,上面的代码里的循环会被优化掉,起不到延时的作用。
应该在最内层的for语句上加“__NOP()”指令,执行一次循环需要5个时钟周期。反汇编如下图:
但是这种写法在优化设置不同的时候,运行的时间相差很大。要想消除优化设置的影响,需要在定义局部变量时,使用“register”关键字让编译器把它们放在寄存器里,而不是放在堆栈里。这样就可以实现每个循环周期都刚好是5个CPU时钟周期的延时函数了。
最佳写法:
void DelayMs(int n)
{
register int i, loops = SystemSYSCLKGet() / 5000;
for( ; n > 0; n--)
for(i = 0; i < loops; i++) __NOP();
}