上篇说过了结构体的成员定义方式对内存损耗的影响,这篇说一下函数的形参个数对ARM编译结果的影响。
ARM 的参数传递遵循 ATPCS 的规范,子程序间通过寄存器 R0-R3 来传递参数,返回值也通过 R0 来返回。这就造成一个问题,当构造超过 4 个参数的函数时,如何实现。
翻阅了其他资料以及下面的代码比对表明,多出来的参数传递的时候,需要使用栈,而栈需要使用额外的指令以及对慢速存储单元的读写,所以不超过 4 个参数的函数是很有利于程序的优化。
测试代码如下:
第一段为采用4个参数的函数:
这段会编译成
第二段为采用6个参数的函数:
而这段又会编译成:
就上面看来,增加了两个参数,就会增加很多代码用来完成这次调用。但是我们也无法保证函数的参数一定是小于4个的,所以这里笔者建议,如果函数的参数必须要4个以上的时候,可以采用结构体的方式来减少参数的个数。
这样的优化,对于一些经常需要调用的函数,或者需要快速响应的情况下,还是非常必要的。