ARM GCC浮点编译选项

最新推荐文章于 2023-04-15 12:01:59 发布

chuanzhilong

最新推荐文章于 2023-04-15 12:01:59 发布

阅读量3.7k

点赞数

分类专栏： Env config

Env config 专栏收录该内容

39 篇文章 0 订阅

订阅专栏

1 浮点类型-mfloat-abi

1.1 选项

-mfloat-abi=soft/softfp/hard

支持3种类型，各类型含义如下：

soft

不使用硬件浮点单元，gcc使用软浮点库来完成浮点运算。适用于不含FPU的CPU。

softfp

使用硬浮点单元，会生成硬浮点指令，生成何种类型的硬浮点指令由-mfpu选项指定。调用接口的规则和soft选项一致。

hard

使用硬浮点单元，生成硬浮点指令。与softfp的区别在于调用接口的规则不同。

1.2 示例

1.2.1 示例代码

float mul(float a, float b)

{

return a*b;

}

1.2.2 soft选项

编译及反汇编命令

arm-linux-gcc -Wall -march=armv7-a -mcpu=cortex-a9 -mfloat-abi=soft -c test.c

arm-linux-objdump -D test.o | less

生成的汇编指令

00000000 <mul>:

0: e92d4800 push {fp, lr}

4: e28db004 add fp, sp, #4

8: e24dd008 sub sp, sp, #8

c: e50b0008 str r0, [fp, #-8]

10: e50b100c str r1, [fp, #-12]

14: e51b0008 ldr r0, [fp, #-8]

18: e51b100c ldr r1, [fp, #-12]

1c: ebfffffe bl 0 <__aeabi_fmul>

20: e1a03000 mov r3, r0

24: e1a00003 mov r0, r3

28: e24bd004 sub sp, fp, #4

2c: e8bd8800 pop {fp, pc}

可以看出是调用__aeabi_fmul接口来进行浮点运算。

1.2.3 softfp选项

编译命令

arm-linux-gcc -Wall -march=armv7-a -mcpu=cortex-a9 -mfloat-abi=softfp -mfpu=vfpv3-d16 -c test.c

生成的汇编指令

00000000 <mul>:

0: e52db004 push {fp} ; (str fp, [sp, #-4]!)

4: e28db000 add fp, sp, #0

8: e24dd00c sub sp, sp, #12

c: e50b0008 str r0, [fp, #-8]

10: e50b100c str r1, [fp, #-12]

14: ed1b7a02 vldr s14, [fp, #-8]

18: ed5b7a03 vldr s15, [fp, #-12]

1c: ee677a27 vmul.f32 s15, s14, s15

20: ee173a90 vmov r3, s15

24: e1a00003 mov r0, r3

28: e28bd000 add sp, fp, #0

2c: e49db004 pop {fp} ; (ldr fp, [sp], #4)

30: e12fff1e bx lr

生成了vxxx的硬浮点指令。并且可以看出和soft一样，都是用r0,r1来传递形参。

1.2.4 hard

编译命令

arm-linux-gcc -Wall -march=armv7-a -mcpu=cortex-a9 -mfloat-abi=hard -mfpu=vfpv3-d16 -c test.c

生成的汇编指令

00000000 <mul>:

0: e52db004 push {fp} ; (str fp, [sp, #-4]!)

4: e28db000 add fp, sp, #0

8: e24dd00c sub sp, sp, #12

c: ed0b0a02 vstr s0, [fp, #-8]

10: ed4b0a03 vstr s1, [fp, #-12]

14: ed1b7a02 vldr s14, [fp, #-8]

18: ed5b7a03 vldr s15, [fp, #-12]

1c: ee677a27 vmul.f32 s15, s14, s15

20: eeb00a67 vmov.f32 s0, s15

24: e28bd000 add sp, fp, #0

28: e49db004 pop {fp} ; (ldr fp, [sp], #4)

2c: e12fff1e bx lr

同样生成了硬浮点指令，与softfp的区别在于，这里使用FPU的寄存器s0、s1来传递形参。

2 使用NEON

2.1 选项

-O3 -mfloat-abi=softfp -mfpu=neon -ftree-vectorize

neon可以做浮点运算，有了neon，可以不使用vfp。

为了提升生成的代码性能，应该使用neon intrinsics的方式来写代码。

2.2 示例

普通代码

void NeonTest(int * x, int * y, int * z)

{

int i;

for(i=0;i<200;i++) {

z[i] = x[i] + y[i];

}

}

neon intrinsics格式的代码

#include <arm_neon.h>

void intrinsics(uint32_t *x, uint32_t *y, uint32_t *z)

{

int i;

uint32x4_t x4,y4; // These 128 bit registers will contain 4 values from the x array and 4 values from the y array

uint32x4_t z4; // This 128 bit register will contain the 4 results from the add intrinsic

uint32_t *ptra = x; // pointer to the x array data

uint32_t *ptrb = y; // pointer to the y array data

uint32_t *ptrz = z; // pointer to the z array data

for(i=0; i < 200/4; i++)

{

x4 = vld1q_u32(ptra); // intrinsic to load x4 with 4 values from x

y4 = vld1q_u32(ptrb); // intrinsic to load y4

z4=vaddq_u32(x4,y4); // intrinsic to add z4=x4+y4

vst1q_u32(ptrz, z4); // store the 4 results to z

ptra+=4; // increment pointers

ptrb+=4;

ptrz+=4;

}

}

转自：http://blog.csdn.net/jijiagang/article/details/12952681

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
ARM GCC浮点编译选项

1 浮点类型-mfloat-abi1.1 选项-mfloat-abi=soft/softfp/hard支持3种类型，各类型含义如下： soft不使用硬件浮点单元，gcc使用软浮点库来完成浮点运算。适用于不含FPU的CPU。 softfp使用硬浮点单
复制链接

扫一扫

专栏目录

chuanzhilong CSDN认证博客专家 CSDN认证企业博客

码龄15年

16: 原创

13万+: 周排名

155万+: 总排名

55万+: 访问

: 等级

4945: 积分

75: 粉丝

105: 获赞

36: 评论

448: 收藏

私信

关注

热门文章

分类专栏

最新评论

linux 静态库的链接 undefined reference
专写bug小能手: 混用了c和cpp的代码经常出现undefined reference function error，就是CPP对函数名称做修饰，导致再使用原来C函数名调用就找不到，在C源文件使用extern C就可以避免CPP对函数名称做修饰。举个例子 gcc 编译了 func.c 源文件，里面函数名就是func()，func.h头文件声明也是 func()名称，但是此时有个 cpp文件 include func.h 并且使用c++编译，链接了func.o,就会出现 undefined reference func() error，即使用 strings 和 nm 查看 func.o里面确实有func()函数，但是c++就是不认识，因为#include头文件里面对函数声明那里就以及重新修饰了该函数
ARM下Kernel panic - not syncing: Attempted to kill init!错误分析
mTicker: 确实这种文章有质量，给出了完整的分析过程跟思路，还有解决方案，支持支持
linux中在/dev/下手动创建设备节点
你水喝多了: 这个似乎不能创建一个不存在的设备节点
ubuntu密码正确，一直无法进入桌面系统，又跳回到登录界面
p65c: tty2 界面我输入账号密码后，又弹回来了，又得重新输入是为啥？？？
ubuntu密码正确，一直无法进入桌面系统，又跳回到登录界面
.PrePLEx: 有用，不过要更正一下 sudo chown username:username .Xauthority 然后会输出[sudo] username ... 这个时候需要输入username对应账户的密码再回车键

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。