在C程序main函数中,接收用户输入任意个整数,然后在main中调用使用ARM汇编编写的函数(在该函数中完成对这些整数的排序功能),然后再在C程序main函数中输出这些排好顺序的整数。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
|
//main.c
#include <stdio.h>
int
main()
{
int
i=0;
int
num=0;
int
*array=NULL;
while
(num <= 0)
//输入数组中元素的个数
{
printf
(
"please enter the number of elements:\n"
);
scanf
(
"%d"
,&num);
if
(num > 0)
{
break
;}
}
if
(NULL == (array = (
int
*)
malloc
(num*
sizeof
(
int
))))
{
printf
(
"malloc failed!\n"
);
exit
(-1);
}
printf
(
"please enter the elements:\n"
);
for
(i = 0; i<num; i++)
{
printf
(
"\n%d:\t"
, i);
scanf
(
"%d"
, array+i);
}
sort(array, num);
//调用相应的汇编的函数,注意分析传参过程
printf
(
"The Result is:\n"
);
for
(i = 0; i<num; i++)
{
printf
(
"%d:\t%d\n"
, i, *(array+i));
}
return
0;
}
|
下面是相应的Sort.s:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
|
.section .text;声明为代码段
.globl
sort
;声明全局变量
sort
: ;linux下需要加冒号
mov r2,
#0
mov r8, r0
mov r9, r0
loop1:
sub r1, r1,
#1
cmp
r2, r1
add r1, r1,
#1
beq end
mov r6, r2
add r3, r2,
#1
loop2:
cmp
r3, r1
beq continue1
mov r3, r3, lsl
#2
add r8, r8, r3
ldr r5, [r8]
mov r6, r6, lsl
#2
add r9, r9, r6
ldr r4, [r9]
cmp
r4, r5
bgt exchange
continue2:
sub r8, r8, r3
mov r3, r3, lsr
#2
sub r9, r9, r6
mov r6, r6, lsr
#2
add r3, r3,
#1
b loop2
exchange:
str r4, [r8]
str r5, [r9]
b continue2
continue1:
add r2, r2,
#1
b loop1
end:
|
注意:通过APCS传过来的两个变量,保存在r0和r1,分别代表是数组的首地址和元素的个数
使用Arm交叉编译通过
/--------------------------------------------------------------------------------------------------------------------------------------
对 于ARM体系来说,不同语言撰写的函数之间相互调用(mix calls)遵循的是 ATPCS(ARM-Thumb Procedure Call Standard),ATPCS主要是定义了函数呼叫时参数的传递规则以及如何从函数返回,关于ATPCS的详细内容可以查看ADS1.2 Online Books ——Developer Guide的2.1节。这篇文档要讲的是汇编代码中对C函数调用时如何进行参数的传递以及如何从C函数正确返回。
不同于x86的参数传递规则,ATPCS建议函数的形参不超过4个,如果形参个数少于或等于4,则形参由R0,R1,R2,R3四个寄存器进行传递;若形参个数大于4,大于4的部分必须通过堆栈进行传递。
我们先讨论一下形参个数为4的情况.
实例1:
test_asm_args.asm
//--------------------------------------------------------------------------------
IMPORT test_c_args ;声明test_c_args函数
AREA TEST_ASM, CODE, READONLY
EXPORT test_asm_args
test_asm_args
STR lr, [sp, #-4]! ;保存当前lr
ldr r0,=0x10 ;参数 1
ldr r1,=0x20 ;参数 2
ldr r2,=0x30 ;参数 3
ldr r3,=0x40 ;参数 4
bl test_c_args ;调用C函数
LDR pc, [sp], #4 ;将lr装进pc(返回main函数)
END
test_c_args.c
//--------------------------------------------------------------------------------
void test_c_args(int a,int b,int c,int d)
{
printk("test_c_args:\n");
printk("%0x %0x %0x %0x\n",a,b,c,d);
}
main.c
//--------------------------------------------------------------------------------
int main()
{
test_asm_args();
for(;;);
}
程序从main函数开始执行,main调用了test_asm_args,test_asm_args调用了test_c_args,最后从 test_asm_args返回main。代码分别使用了汇编和C定义了两个函数,test_asm_args 和 test_c_args,test_asm_args调用了test_c_args,其参数的传递方式就是向R0~R3分别写入参数值,之后使用bl语句 对test_c_args进行调用。其中值得注意的地方是用红色标记的语句,test_asm_args在调用test_c_args之前必须把当前的 lr入栈,调用完test_c_args之后再把刚才保存在栈中的lr写回pc,这样才能返回到main函数中。
如果test_c_args的参数是8个呢?这种情况test_asm_args应该怎样传递参数呢?
实例2:
test_asm_args.asm
//--------------------------------------------------------------------------------
IMPORT test_c_args ;声明test_c_args函数
AREA TEST_ASM, CODE, READONLY
EXPORT test_asm_args
test_asm_args
STR lr, [sp, #-4]! ;保存当前lr
ldr r0,=0x1 ;参数 1
ldr r1,=0x2 ;参数 2
ldr r2,=0x3 ;参数 3
ldr r3,=0x4 ;参数 4
ldr r4,=0x8
str r4,[sp,#-4]! ;参数 8 入栈
ldr r4,=0x7
str r4,[sp,#-4]! ;参数 7 入栈
ldr r4,=0x6
str r4,[sp,#-4]! ;参数 6 入栈
ldr r4,=0x5
str r4,[sp,#-4]! ;参数 5 入栈
bl test_c_args_lots
ADD sp, sp, #4 ;清除栈中参数 5,本语句执行完后sp指向 参数6
ADD sp, sp, #4 ;清除栈中参数 6,本语句执行完后sp指向 参数7
ADD sp, sp, #4 ;清除栈中参数 7,本语句执行完后sp指向 参数8
ADD sp, sp, #4 ;清除栈中参数 8,本语句执行完后sp指向 lr
LDR pc, [sp],#4 ;将lr装进pc(返回main函数)
END
test_c_args.c
//--------------------------------------------------------------------------------
void test_c_args(int a,int b,int c,int d,int e,int f,int g,int h)
{
printk("test_c_args_lots:\n");
printk("%0x %0x %0x %0x %0x %0x %0x %0x\n",
a,b,c,d,e,f,g,h);
}
main.c
//--------------------------------------------------------------------------------
int main()
{
test_asm_args();
for(;;);
}
这部分的代码和实例1的代码大部分是相同的,不同的地方是test_c_args的参数个数和test_asm_args的参数传递方式。
在test_asm_args中,参数1~参数4还是通过R0~R3进行传递,而参数5~参数8则是通过把其压入堆栈的方式进行传递,不过要注意这四个入栈参数的入栈顺序,是以参数8->参数7->参数6->参数5的顺序入栈的。
直到调用test_c_args之前,堆栈内容如下:
sp->+----------+
| 参数5 |
+----------+
| 参数6 |
+----------+
| 参数7 |
+----------+
| 参数8 |
+----------+
| lr |
+----------+
test_c_args执行返回后,则设置sp,对之前入栈的参数进行清除,最后将lr装入pc返回main函数,在执行 LDR pc, [sp],#4 指令之前堆栈内容如下:
+----------+
| 参数5 |
+----------+
| 参数6 |
+----------+
| 参数7 |
+----------+
| 参数8 |
sp->+----------+
| lr |
+----------+