[ARM]内联汇编

内联汇编语法

在这里插入图片描述

语法

(1)asm

​ 这块直接写做

__asm__ 

​ 表示这是一段内联汇编。

(2)asm-qualifiers

​ 这里取值有三种 volatile , inline , goto:

​ volatile的意思是易变的、不稳定的,用来告诉编译器不要随便优化这段代码,否则可能出问题。比如汇编指令“mov r0, r0”,它把r0的值复制到r0,并没有实际做什么事情,你的本意可能是用这条指令来延时。编译器看到这指令后,可能就把它去掉了。加上volatile的话,编译器就不会擅自优化。

(3)AssemblerTemplate

​ 汇编指令,用双引号包含起来,每条指令用“\n”分开,比如:

"mov %0 , %1\n"
"add %0 , %1 ,%2\n"

**(4)OutputOperands **

​ 输出操作数,内联汇编执行时,输出的结果保存在哪里。格式如下,当有多个变量时,用逗号隔开:

[ [asmSymbolicName] ] constraint (cvariablename)

asmSymbolicName 是符号名 ,随便取,也可以不写

constraint表示约束,有如下常用取值:

constraint描述
mmemory operand,表示要传入有效的地址,只要CPU能支持该地址,就可以传入
rregister operand,寄存器操作数,使用寄存器来保存这些操作数
iimmediate integer operand,表示可以传入一个立即数

cvariablename:C语言的变量名。

​ 示例1如下:

[result] "=r" (sum)

​ 它的意思是汇编代码中会通过某个寄存器把结果写入sum变量。在汇编代码中可以使用“%[result]”来引用它。

​ 示例2如下:

"=r" (sum)

​ 在汇编代码中可以使用“%0”、“%1”等来引用它,这些数值怎么确定后面再说。

(5)InputOperands

​ 入操作数,内联汇编执行前,输入的数据保存在哪里。格式如下,当有多个变量时,用逗号隔开:

[ [asmSymbolicName] ] constraint (cexpression)

​ asmSymbolicName是符号名,随便取,也可以不写。

​ constraint表示约束,参考上一小节,跟OutputOperands类似。

cexpression:C语言的表达式。

​ 示例1如下:

[a_val]"r"(a), [b_val]"r"(b)

​ 它的意思变量a、b的值会放入某些寄存器。在汇编代码中可以使用%[a_val]、%[b_val]使用它们。

​ 示例2如下:

"r"(a), "r"(b)

​ 它的意思变量a、b的值会放入某些寄存器。在汇编代码中可以使用%0、%1等使用它们,这些数值后面再说。

(6)Clobbers

​ 在汇编代码中,对于“OutputOperands”所涉及的寄存器、内存,肯定是做了修改。但是汇编代码中,也许要修改的寄存器、内存会更多。比如在计算过程中可能要用到r3保存临时结果,我们必须在“Clobbers”中声明r3会被修改。

​ 下面是一个例子:

: "r0", "r1", "r2", "r3", "r4", "r5", "memory"

​ 我们常用的是有“cc”、“memory”,意义如下:

Clobbers描述
cc表示汇编代码会修改“flags register”
memory表示汇编代码中,除了“InputOperands”和“OutputOperands”中指定的之外, 还会读、写更多的内存

实践

​ (1)首先来分析一个累加汇编函数

int add(int a, int b)
{
     int sum;
     __asm__ volatile (
             "add %0, %1, %2"
             :"=r"(sum)
             :"r"(a), "r"(b)
             :"cc"
     );
     return sum;

根据上述的语法进行分解

(1)  __asm__			// 内联汇编
(2)  volatile			// 告诉编译器不能优化
(3)  add %0, %1, %2		// 汇编语句
(4)  "=r"(sum)			// %0 = sum
(5)  "r"(a), "r"(b)		 // %1 = a  %2 = b
(6)  "cc"				//加法可能改变 cpsr上的flag标志位

​ (2)进阶版, 已知 在ARMv8架构中 的异常等级分为 EL0,EL1,EL2,EL3 ,想从 EL0 通过 EL3 必须使用 “smc #0”指令

,并且需要配置 r0, r1 ,r2 ,r3 , r4 , r5这些寄存器充当传参,在EL3执行完相应的服务后会将返回值返回到寄存器r0,如何实现该功能?

​ 先分解条件

(1)  __asm__			// 内联汇编
(2)  volatile			// 告诉编译器不能优化
(3)  ldr r0 , =%[val0]
     ldr r1 , =%[val1]
     ldr r2 , =%[val2]
     ldr r3 , =%[val3]
     ldr r4 , =%[val4]
     ldr r5 , =%[val5]
     smc #0				
     mov %[result],r0    // 汇编语句
(4)  [result]"=r"(ret)	 // 输出赋值 
(5)  [val0]"r"(a0),[val1]"r"(a1),[val2]"r"(a2),[val3]"r"(a3),[val4]"r"(a4),[val5]"r"(a5)	//输入赋值
(6)  "r0"				// r0寄存器需要被修改

内联汇编

unsigned int smc(unsigned int a0, unsigned int a1, unsigned int a2, unsigned int a3, unsigned int a4, unsigned int a5)
{
    unsigned int ret;
    __asm__ volatile(
    		"ldr r0 , =%[val0]\n"
        	"ldr r1 , =%[val1]\n"
         	"ldr r2 , =%[val2]\n"
        	"ldr r3 , =%[val3]\n"
          	"ldr r4 , =%[val4]\n"
         	"ldr r5 , =%[val5]\n"
        	"smc #0\n"
  		    "mov %[result],r0\n"
        	:[result]"=r"(ret)
        	:[val0]"r"(a0),[val1]"r"(a1),[val2]"r"(a2),[val3]"r"(a3),[val4]"r"(a4),[val5]"r"(a5)
        	:"r0"
    );
    return ret;
}
  • 7
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
根据引用\[1\]和引用\[2\]的内容,Arm内联汇编代码的一般格式可以参考https://gcc.gnu.org/onlinedocs/gcc/Extended-Asm.html#Extended-Asm。在Arm中,通过手动操作寄存器来优化数据读写、数据计算和指令重排可以进一步加速程序。根据引用\[3\]中的代码,以下是一个耗时1秒的Arm汇编程序的示例: ```assembly .global main .section .data .section .text main: mov r0, #1000000000 // 设置循环次数 mov r1, #0 // 设置计数器 mov r2, #0 // 设置累加器 loop: add r2, r2, #1 // 累加器加1 add r1, r1, #1 // 计数器加1 cmp r1, r0 // 比较计数器和循环次数 blt loop // 如果计数器小于循环次数,则跳转到loop标签处 mov r7, #1 // 设置系统调用号为1(退出程序) mov r0, #0 // 设置退出码为0 swi 0 // 调用系统调用 ``` 这段汇编代码使用了一个简单的循环来模拟耗时1秒的程序。在循环中,累加器r2每次加1,计数器r1也每次加1,直到计数器达到设定的循环次数。然后,程序调用系统调用退出。请注意,这只是一个示例,实际的耗时程序可能会更加复杂。 #### 引用[.reference_title] - *1* *2* *3* [【Arm端算法优化笔记】一,一步步优化盒子滤波算法](https://blog.csdn.net/just_sort/article/details/107734175)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值