【性能测评】DSP库,MDK5的AC5,AC6,IAR和Embedded Studio的三角函数性能

测试条件:
1、IAR8.30开最高等级速度优化。
2、MDK5.27正式版使用AC5开最高等级优化3,开启时间优化,测试C标准库和微库MicroLib两种。
3、MDK5.27正式版使用AC6开最高等级的速度优化,测试C标准库和微库MicroLib两种。
4、Embedded Studio4.30版使用GCC开最高等级优化,开C库使用Fast模式。
5、Embedded Studio4.30版使用CLANG开最高等级优化,开C库使用Fast模式。
6、DSP库使用最新的CMSIS软件包里面的V5.6.0。
7、测试单位使用DWT时钟周期计数器。
8、DSP库使用函数arm_sin_f32测试,IAR,MDK和ES都使用各自带的C库测试。执行10次,求平均。
注意,IAR,MDK和ES都有各自的C库实现方案。

提供一个STM32H7的例程供大家测评:
MDKIARES-USART.rar 


1、MDK5 AC5 MicroLib
(1)DSP库函数第一次执行73个时钟周期,之后重复执行都是55个时钟周期左右。
(2)微库的sin函数259,之后重复执行是197个时钟周期左右。

2、MDK5 AC5 C Lib
(1)DSP库函数第一次执行71个时钟周期,之后重复执行都是55个时钟周期左右。
(2)C库的sin函数264,之后重复执行是200个时钟周期左右。

3、MDK5 AC6 MicroLib
(1)DSP库函数第一次执行81个时钟周期,之后重复执行都是58个时钟周期左右。
(2)C库的sin函数,使用DWT时钟周期计数器无法正常测量。

4、MDK5 AC6 C Lib
(1)DSP库函数第一次执行74个时钟周期,之后重复执行都是58个时钟周期左右。
(2)C库的sin函数,使用DWT时钟周期计数器无法正常测量。

5、IAR
(1)DSP库函数第一次执行83个时钟周期,之后重复执行都是58个时钟周期左右。
(2)C库的sin函数217,之后重复执行是194个时钟周期左右。

6、Embedded Studio GCC
(1)DSP库函数第一次执行79个时钟周期,之后重复执行都是49个时钟周期左右。
(2)C库的sin函数140,之后重复执行是129个时钟周期左右。

7、Embedded Studio CLANG
(1)DSP库函数第一次执行80个时钟周期,之后重复执行都是59个时钟周期左右。
(2)C库的sin函数141,之后重复执行是129个时钟周期左右。


MDK5的AC5开启的优化等级:


MDK5的AC6开启的优化等级:


MDK使用微库和C库通过这个对勾切换:


IAR开启的优化等级


Embedded Studio优化等级和C库选Fast模式




总结:
1、DSP库的三角函数计算在MDK,IAR和ES上的性能都差不多。
2、使用MDK的AC6时,使用DWT是周期计数器无法正常测量C库做三角函数运算的执行时间,时间非常短,感觉异常了,所以暂不加入比较。
3、MDK AC5和IAR的C库三角函数性能差不多,而ES的三角函数性能比较强劲,比MDK和IAR的强很多。
4、当前仅测试一个sin函数,后面有精力做一个全面的三角函数比较。

### 解决STM32F103从MDK AC5切换到AC6时启动文件编译错误 当从MDK AC5迁移到MDK AC6时,可能会遇到一些兼容性配置上的差异,这些差异可能导致编译错误。以下是针对这些问题的具体解决方案: #### 配置工具链版本 确保项目设置中的工具链版本已更改为ARM Compiler 6 (AC6)[^1]。这可以通过以下路径完成:`Project -> Options for Target 'Target 1' -> C/C++ Tab -> Toolchain`. #### 更新启动文件 对于STM32F103系列微控制器,在使用AC6编译器时可能需要更新启动文件(`startup_stm32f103xb.s`)以适应新的语法特性支持。通常情况下,ST官方提供了适用于不同编译器版本的启动文件。 如果当前使用的启动文件不是专门为AC6准备的,则建议下载并替换为最新版的支持包中提供的对应文件。可以从ST官方网站获取最新的支持材料。 #### 修改链接脚本 检查项目的链接脚本(.ld),确认其与所选设备相匹配,并且遵循了AC6的要求。某些旧版本的链接描述符可能不再适用或需调整参数定义方式。 ```c /* Example of a modified linker script section */ MEMORY { FLASH (rx) : ORIGIN = 0x8000000, LENGTH = 128K /* Adjust according to your device's flash size */ RAM (rwx) : ORIGIN = 0x20000000, LENGTH = 20K /* And SRAM capacity */ } ``` #### 调整编译选项 部分编译警告级别、优化等级以及其他构建属性也需要重新评估,因为它们在两个编译环境之间可能存在细微差别。通过对比文档了解两者之间的主要变化点有助于减少潜在冲突。 #### 测试与验证 最后一步是在修改完成后进行全面测试,包括但不限于功能回归测试以及性能分析,确保迁移过程不会引入新问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值