1.Divison
ARM没有在硬件层面提供除法指令,而是在C库中通过软件的手段实现除法。
如下例子:
offset = (offset + increment)%buffer_size;
offset += increment;
if(offset >= buffer_size)
{
offset -= buffer_size;
}
/*第一种形式使用了除法,需要消耗50个周期。而第二种形式却仅仅消耗了3个周期。所以尽量不要使用除法*/
- 如果你无法避免使用除法,那么就使用unsigned interger作为分子、分母。unsigned比signed要快,因为signed在运算之前还要转换为unsigned数。
同时使用% /是更高效的
例如:
x = offset % bytes_per_line;
y = offset / bytes_per_line;
//在转换为汇编的时候,只用较少的指令即可完成任务。
2.Floating Point
在一些例如ARM7500FE中使用了Floating Point Accelerator(FPA)和Vector Floating Point Accelerator(VFP)硬件。因此C compiler必须在软件层面支持浮点运算。
- 实际上支持浮点数,意味着C compiler在floating-point 操作的时候都进行了函数调用。C库使用了整型数来仿真浮点运算。这些代码使用了高度优化的汇编代码。综上所述浮点运算是很慢的。
- 分数是经常在audio和video处理数字信号的时候使用到的。
3. inline functions and inline assmbly
内联函数能提高效率,内联汇编能够做到C语言无法做到的事情,也能有效的提高效率。