嵌入式C语言笔记02——ARM编译器对局部变量和入口参数的处理
见下面代码,显然程序的功能是将以data开始的64个整数进行累加,函数的返回值是这64个整数的累加和。表面上没有问题,但是当阅读汇编代码后就会发现问题:
下面是汇编代码:
CheckSum
MOV r2,r0
MOV r0,#0
MOV r1,#0
CheckSum_Loop
LDR r3,[r2,r1,LSL #2]
ADD r1,r1,#1
AND r1,r1,#0xff ; Becareful this
CMP r1,#0x40
ADD r0,r3,r0
BCC CheckSum_Loop
MOV pc,r14 ;return sum
编译器在对i自加后,为什么要有一条AND指令呢?这是因为ARM处理器,不管变量的宽度是1个字节,2个字节还是4个字节都是用32位宽度的寄存器来进行存储的。对于i这个变量,虽然C语言中声明它的宽度是1个字节,但是r1寄存器的宽度确实4个字节,因此在累加后,编译器必须插入AND那条语句将r1累加后的值约束在低8位,以确保它的值小于一个8位数能表示的最大值255.
显然这条语句是多余的。
如果我们在程序中不是将i声明
见下面代码,显然程序的功能是将以data开始的64个整数进行累加,函数的返回值是这64个整数的累加和。表面上没有问题,但是当阅读汇编代码后就会发现问题:
int checkSum(int *data){
char i;
int sum = 0;
for(i = 0;i<64;i++)
sum +=data[i];
return sum;
}
下面是汇编代码:
CheckSum
MOV r2,r0
MOV r0,#0
MOV r1,#0
CheckSum_Loop
LDR r3,[r2,r1,LSL #2]
ADD r1,r1,#1
AND r1,r1,#0xff ; Becareful this
CMP r1,#0x40
ADD r0,r3,r0
BCC CheckSum_Loop
MOV pc,r14 ;return sum
编译器在对i自加后,为什么要有一条AND指令呢?这是因为ARM处理器,不管变量的宽度是1个字节,2个字节还是4个字节都是用32位宽度的寄存器来进行存储的。对于i这个变量,虽然C语言中声明它的宽度是1个字节,但是r1寄存器的宽度确实4个字节,因此在累加后,编译器必须插入AND那条语句将r1累加后的值约束在低8位,以确保它的值小于一个8位数能表示的最大值255.
显然这条语句是多余的。
如果我们在程序中不是将i声明