arm linux gnueabi编译,交叉编译器 arm-linux-gnueabi 和 arm-linux-gnueabihf 的区别

本身以前一直没搞清楚这两个交叉编译器到底有什么问题,特地google一番,总结以下,但愿能帮到道上和我有一样困惑的兄弟…..linux

一. 什么是ABI和EABI

1) ABI: 二进制应用程序接口(Application Binary Interface (ABI) for the ARM Architecture)

在计算机中,应用二进制接口描述了应用程序(或者其余类型)和操做系统之间或其余应用程序的低级接口.

ABI涵盖了各类细节,如:

数据类型的大小、布局和对齐;

调用约定(控制着函数的参数如何传送以及如何接受返回值),例如,是全部的参数都经过栈传递,仍是部分参数经过寄存器传递;哪一个寄存器用于哪一个函数参数;经过栈传递的第一个函数参数是最早push到栈上仍是最后;

系统调用的编码和一个应用如何向操做系统进行系统调用;

以及在一个完整的操做系统ABI中,目标文件的二进制格式、程序库等等。

一个完整的ABI,像Intel二进制兼容标准 (iBCS) ,容许支持它的操做系统上的程序不经修改在其余支持此ABI的操做体统上运行。

ABI不一样于应用程序接口(API),API定义了源代码和库之间的接口,所以一样的代码能够在支持这个API的任何系统中编译,ABI容许编译好的目标代码在使用兼容ABI的系统中无需改动就能运行。架构

2) EABI: 嵌入式ABI

嵌入式应用二进制接口指定了文件格式、数据类型、寄存器使用、堆积组织优化和在一个嵌入式软件中的参数的标准约定。

开发者使用本身的汇编语言也可使用EABI做为与兼容的编译器生成的汇编语言的接口。

支持EABI的编译器建立的目标文件能够和使用相似编译器产生的代码兼容,这样容许开发者连接一个由不一样编译器产生的库。

EABI与关于通用计算机的ABI的主要区别是应用程序代码中容许使用特权指令,不须要动态连接(有时是禁止的),和更紧凑的堆栈帧组织用来节省内存。普遍使用EABI的有Power PC和ARM.函数

二. gnueabi相关的两个交叉编译器: gnueabi和gnueabihf

在debian源里这两个交叉编译器的定义以下:

gcc-arm-linux-gnueabi – The GNU C compiler for armel architecture

gcc-arm-linux-gnueabihf – The GNU C compiler for armhf architecture

可见这两个交叉编译器适用于armel和armhf两个不一样的架构, armel和armhf这两种架构在对待浮点运算采起了不一样的策略(有fpu的arm才能支持这两种浮点运算策略)工具

其实这两个交叉编译器只不过是gcc的选项-mfloat-abi的默认值不一样. gcc的选项-mfloat-abi有三种值soft,softfp,hard(其中后二者都要求arm里有fpu浮点运算单元,soft与后二者是兼容的,但softfp和hard两种模式互不兼容):

soft   : 不用fpu进行浮点计算,即便有fpu浮点运算单元也不用,而是使用软件模式。

softfp : armel架构(对应的编译器为gcc-arm-linux-gnueabi)采用的默认值,用fpu计算,可是传参数用普通寄存器传,这样中断的时候,只须要保存普通寄存器,中断负荷小,可是参数须要转换成浮点的再计算。

hard   : armhf架构(对应的编译器gcc-arm-linux-gnueabihf)采用的默认值,用fpu计算,传参数也用fpu中的浮点寄存器传,省去了转换, 性能最好,可是中断负荷高。布局

把如下测试使用的c文件内容保存成mfloat.c:

#include

int main(void)

{

double a,b,c;

a = 23.543;

b = 323.234;

c = b/a;

printf(“the 13/2 = %f\n”, c);

printf(“hello world !\n”);

return 0;

}性能

1)使用arm-linux-gnueabihf-gcc编译,使用“-v”选项以获取更详细的信息:

# arm-linux-gnueabihf-gcc -v mfloat.c

COLLECT_GCC_OPTIONS=’-v’ ‘-march=armv7-a’ ‘-mfloat-abi=hard’ ‘-mfpu=vfpv3-d16′ ‘-mthumb’

-mfloat-abi=hard,可看出使用hard硬件浮点模式。测试

2)使用arm-linux-gnueabi-gcc编译:

# arm-linux-gnueabi-gcc -v mfloat.c

COLLECT_GCC_OPTIONS=’-v’ ‘-march=armv7-a’ ‘-mfloat-abi=softfp’ ‘-mfpu=vfpv3-d16′ ‘-mthumb’

-mfloat-abi=softfp,可看出使用softfp模式。优化

三. 拓展阅读

下文阐述了ARM代码编译时的软浮点(soft-float)和硬浮点(hard-float)的编译以及连接实现时的不一样。从VFP浮点单元的引入到软浮点(soft-float)和硬浮点(hard-float)的概念google

VFP (vector floating-point)

从ARMv5开始,就有可选的 Vector Floating Point (VFP) 模块,固然最新的如 Cortex-A8, Cortex-A9 和 Cortex-A5 能够配置成不带VFP的模式供芯片厂商选择。

VFP通过若干年的发展,有VFPv2 (一些 ARM9 / ARM11)、 VFPv3-D16(只使用16个浮点寄存器,默认为32个)和VFPv3+NEON (如大多数的Cortex-A8芯片) 。对于包含NEON的ARM芯片,NEON通常和VFP公用寄存器。编码

硬浮点Hard-float

编译器将代码直接编译成发射给硬件浮点协处理器(浮点运算单元FPU)去执行。FPU一般有一套额外的寄存器来完成浮点参数传递和运算。

使用实际的硬件浮点运算单元FPU固然会带来性能的提高。由于每每一个浮点的函数调用须要几个或者几十个时钟周期。

软浮点 Soft-float

编译器把浮点运算转换成浮点运算的函数调用和库函数调用,没有FPU的指令调用,也没有浮点寄存器的参数传递。浮点参数的传递也是经过ARM寄存器或者堆栈完成。

如今的Linux系统默认编译选择使用hard-float,即便系统没有任何浮点处理器单元,这就会产生非法指令和异常。于是通常的系统镜像都采用软浮点以兼容没有VFP的处理器。

armel ABI和armhf ABI

在armel中,关于浮点数计算的约定有三种。以gcc为例,对应的-mfloat-abi参数值有三个:soft,softfp,hard。

soft是指全部浮点运算所有在软件层实现,效率固然不高,会存在没必要要的浮点到整数、整数到浮点的转换,只适合于早期没有浮点计算单元的ARM处理器;

softfp是目前armel的默认设置,它将浮点计算交给FPU处理,但函数参数的传递使用通用的整型寄存器而不是FPU寄存器;

hard则使用FPU浮点寄存器将函数参数传递给FPU处理。

须要注意的是,在兼容性上,soft与后二者是兼容的,但softfp和hard两种模式不兼容。

默认状况下,armel使用softfp,所以将hard模式的armel单独做为一个abi,称之为armhf。

而使用hard模式,在每次浮点相关函数调用时,平均能节省20个CPU周期。对ARM这样每一个周期都很重要的体系结构来讲,这样的提高无疑是巨大的。

在彻底不改变源码和配置的状况下,在一些应用程序上,使用armhf能获得20%——25%的性能提高。对一些严重依赖于浮点运算的程序,更是能够达到300%的性能提高。

Soft-float和hard-float的编译选项

在CodeSourcery gcc的编译参数上,使用-mfloat-abi=name来指定浮点运算处理方式。-mfpu=name来指定浮点协处理的类型。

可选类型如fpa,fpe2,fpe3,maverick,vfp,vfpv3,vfpv3-fp16,vfpv3-d16,vfpv3-d16-fp16,vfpv3xd,vfpv3xd-fp16,neon,neon-fp16,vfpv4,vfpv4-d16,fpv4-sp-d16,neon-vfpv4等。

使用-mfloat-abi=hard (等价于-mhard-float) -mfpu=vfp来选择编译成硬浮点。使用-mfloat-abi=softfp就能兼容带VFP的硬件以及soft-float的软件实现,运行时的链接器ld.so会在执行浮点运算时对于运算单元的选择,

是直接的硬件调用仍是库函数调用,是执行/lib仍是/lib/vfp下的libm。-mfloat-abi=soft (等价于-msoft-float)直接调用软浮点实现库。

在ARM RVCT工具链下,定义fpu模式:

–fpu softvfp

–fpu softvfp+vfpv2

–fpu softvfp+vfpv3

–fpu softvfp+vfpv_fp16

–fpu softvfp+vfpv_d16

–fpu softvfp+vfpv_d16_fp16.

定义浮点运算类型

–fpmode ieee_full : 全部单精度float和双精度double的精度都要和IEEE标准一致,具体的模式能够在运行时动态指定;

–fpmode ieee_fixed : 舍入到最接近的实现的IEEE标准,不带不精确的异常;

–fpmode ieee_no_fenv :舍入到最接近的实现的IEEE标准,不带异常;

–fpmode std :非规格数flush到0、舍入到最接近的实现的IEEE标准,不带异常;

–fpmode fast : 更积极的优化,可能会有一点精度损失。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在信号处理领域,DOA(Direction of Arrival)估计是一项关键技术,主要用于确定多个信号源到达接收阵列的方向。本文将详细探讨三种ESPRIT(Estimation of Signal Parameters via Rotational Invariance Techniques)算法在DOA估计中的实现,以及它们在MATLAB环境中的具体应用。 ESPRIT算法是由Paul Kailath等人于1986年提出的,其核心思想是利用阵列数据的旋转不变性来估计信号源的角度。这种算法相比传统的 MUSIC(Multiple Signal Classification)算法具有较低的计算复杂度,且无需进行特征值分解,因此在实际应用中颇具优势。 1. 普通ESPRIT算法 普通ESPRIT算法分为两个主要步骤:构造等效旋转不变系统和估计角度。通过空间平移(如延时)构建两个子阵列,使得它们之间的关系具有旋转不变性。然后,通过对子阵列数据进行最小二乘拟合,可以得到信号源的角频率估计,进一步转换为DOA估计。 2. 常规ESPRIT算法实现 在描述中提到的`common_esprit_method1.m`和`common_esprit_method2.m`是两种不同的普通ESPRIT算法实现。它们可能在实现细节上略有差异,比如选择子阵列的方式、参数估计的策略等。MATLAB代码通常会包含预处理步骤(如数据归一化)、子阵列构造、旋转不变性矩阵的建立、最小二乘估计等部分。通过运行这两个文件,可以比较它们在估计精度和计算效率上的异同。 3. TLS_ESPRIT算法 TLS(Total Least Squares)ESPRIT是对普通ESPRIT的优化,它考虑了数据噪声的影响,提高了估计的稳健性。在TLS_ESPRIT算法中,不假设数据噪声是高斯白噪声,而是采用总最小二乘准则来拟合数据。这使得算法在噪声环境下表现更优。`TLS_esprit.m`文件应该包含了TLS_ESPRIT算法的完整实现,包括TLS估计的步骤和旋转不变性矩阵的改进处理。 在实际应用中,选择合适的ESPRIT变体取决于系统条件,例如噪声水平、信号质量以及计算资源。通过MATLAB实现,研究者和工程师可以方便地比较不同算法的效果,并根据需要进行调整和优化。同时,这些代码也为教学和学习DOA估计提供了一个直观的平台,有助于深入理解ESPRIT算法的工作原理。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值