ARM复位启动先执行汇编指令,完成硬件的初始化(为什么不用C语言?因为C语言无法访问ARM内部的寄存器,例如栈,所以需要汇编来进行初始化)
C语言能不能跟汇编相互并且反复调用?
不能,因为这样容易导致局部变量的混用。
汇编调用C程序
.global _start
_start:
@将GPJ2_3 --->output
LDR R0, =0xe0200280 //R0=0xe0200280
LDR R1, [R0] //R1=0xe0200280地址下的内容
BIC R1,R1,#(0xf<<12) //R1 &= ~(0xf<<12)
ORR R1, R1, #(1<<12) //R1 |= (1<<12)
STR R1,[R0] //将R1 保存到 0xe0200280
loop:
@将GPJ2_3 output 0,LED4-->on
LDR R0, =0xe0200284 //R0=0xe0200284
LDR R1, [R0] //R1=0xe0200284地址下的内容
BIC R1,R1,#(1<<3) //R1 &= ~(1<<3)
STR R1,[R0] //将R1 保存到 0xe0200284
mov R0, #0x300000 //R0作为参数,传递给delay()
BL delay //BL -- 在跳转之前,保存了返回地址-->R14
@将GPJ2_3 output 1,LED4-->off
LDR R0, =0xe0200284 //R0=0xe0200284
LDR R1, [R0] //R1=0xe0200284地址下的内容
ORR R1, R1, #(1<<3) //R1 |= (1<<3)
STR R1,[R0] //将R1 保存到 0xe0200284
mov R0, #0x300000 //R0作为参数,传递给delay()
BL delay
b loop //while(1) b--branch
C
void delay(int time) //time <---R0
{
int i;
for(i=0;i<time;i++);
}
这里传参按照ATPCS,R0~R3给予相应的值那么就作为相应的子程序的传参,需要几个就设定几个,多了的话就需要压栈,如果参数是8个的话参数1~参数4还是通过R0~R3进行传递,而参数5~参数8则是通过压入堆栈的方式进行传递,注意这四个入栈参数的入栈顺序,是以参数8->参数7->参数6->参数5的顺序入栈的。
编译器的优化和volatile
gcc有几个优化等级:
O0,O1,O2,O3
-O0表示没有优化,-O1为缺省值,-O3优化级别最高。
通过优化之后可以通过 size filename.c指令看出相关的文本大小的变化,但是优化不一定是往好的方向发展,如果我们写了延时是用
for(i=0;i<100;i++)
这样实现的话那么编译器就会帮我们优化删除代码,因为编译器认为这是无意义的操作,那么避免被优化,上面的例子,初始化i语言变为
volatile int i;
volatile用来修饰一个“易变的”变量,每次使用这个变量的时候都重新从内存中读取它的值,防止被编译器优化。
voltale的应用场合:
**1)中断服务程序和应用程序之间共享的全局变量
2)两个线程之间共享的全局变量
3)定义硬件寄存器的内存**
C调用汇编
C代码
#define rGPJ2CON (*( volatile unsigned int *)0xe0200280)
#define rGPJ2DAT (*( volatile unsigned int *)0xe0200284)
//GPJ2_3 ----> LED4
extern void delay(int dat);
void _start(void) //相当于main()
{
//将GPJ2_3 --->output
rGPJ2CON &= ~(0xf<<12);
rGPJ2CON |= (1<<12);
while(1)
{
//将GPJ2_3 output 0,LED4-->on
rGPJ2DAT &= ~(1<<3);
delay(0x3000000); //
//将GPJ2_3 output 1,LED4-->off
rGPJ2DAT |= (1<<3); //1000b
delay(0x3000000);
}
}
汇编代码
.global delay
delay:
SUB R0,R0,#1 // R2=R2-1
TEQ R0, #0 //compare if(R2 == 0)
BNE delay //B--branch,NE -- Not Equal
bx lr // R15=R14, delay返回
arm-linux-gcc支持C内嵌汇编。