如何正确使用MDK-ARM优化功能,以及优化之后带来的影响(MDK-ARM各种优化选项详细说明、实际应用及拓展内容)

原文:MDK-ARM各种优化选项详细说明、实际应用及拓展内容

 

许多朋友使用MDK-ARM很长时间,却不知它的优化选项到底该有什么用,或者说到底该如何使用。

 

本文围绕MDK-ARM优化选项,以及相关拓展知识(微库、实际应用、调试)进行讲述,希望对你今后开发项目有所帮助。

 

1总述

我们所指的优化,主要两方面:

  • 代码大小(Size)

  • 代码性能(运行时间)

 

在MDK-ARM中,优化相关的配置选项:

 

当然,如果选择编译器(AC5、AC6)不同,优化选项也有差异(下面讲述)。

 

举例:

某些项目MCU容量有限时,你除了修改代码(优化开支),同时你有必要使用优化选项。

 

某些项目(比如某算法)需要高效(最短时间)运行,此时有必要使用优化选项。

 

2优化选项说明

本节详细讲述优化相关选项,同时,编译器选择AC5和AC6时有差异,下面也会针对AC5和6分别讲述。

 

1.Use Cross-Module Optimization:使用跨模块优化

使用跨模块优化可以启用链接器反馈文件(进行两次编译),从而允许进一步的代码优化。

 

提示:

A.不针对库目标执行跨模块优化。

B.跨模块优化将增加构建项目所需的时间,因为会自动执行多个编译和链接步骤。

 

2.Use MicroLIB:使用微库

它是ISO标准C运行时库的子集(其中一部分),提供了性能和代码大小之间的权衡。

 

微库并不完全兼容ANSI,但对于大多数小型嵌入式应用程序来说已经足够了。

 

3.Use Link-Time Code Generation:使用链接时代码生成(优化)

在V5版本之前有这个优化选项,多文件编译,链接时进行优化:

  • 函数跨模块内联

  • 删除未引用的变量和函数

  • 通过重新排列变量优化内存访问

  • 在可能的情况下重用内存


4.Execute-only Code:生成只执行的代码

不包含未使用(函数、变量等)代码段。

 

仅限于:

C、Thumb代码

基于Cortex-M3、M4的处理器

编译器5.04以上

 

5.Optimize for Time:优化时间

以更大的代码大小为代价,减少执行时间。比如:使用内联函数。

 

编译器为AC6时,此选项为【Link-Time Optimization】,在链接状态下执行模块间优化。

 

6.Split Load and Store Multiple:分割加载和多存储

指示编译器将LDM和STM指令拆分为两个或多个LDM或STM指令,以减少延迟,此选项可以提高系统的总体性能。

 

7.The One ELF Section per Function:每个函数一个ELF段

ELF代码段通常包含许多函数的代码,此选项告诉编译器将所有函数放入它们自己的ELF段,这允许链接器删除未使用的ELF段(而不是未使用的函数)。

 

8.AC5时:Optimization优化选项

<default>:默认值,以优化性能为主。

 

Level 0 (-O0):关闭大部分优化,除了一些简单的转换,生成的代码具有最佳的调试视图。

 

Level 1 (-O1):应用受限优化。

比如:删除未使用的内联函数和静态函数,删除冗余代码和重新排序指令等。生成的代码经过合理优化,具有良好的调试视图。

 

Level 2 (-O2): 高度优化,目标代码到源代码的映射并不一定对应,因此,不利于调试。

 

Level 3 (-O3):最大级别优化,级别3与时间优化相结合可能生成比级别2更多的代码。

 

9.AC6时:Optimization优化选项

当编译器选择AC6时,优化选项有差异(有更多优化选项):

 

AC6优化选型中前面5项(default、-O0 ~ 3)和AC5的作用基本一样,但AC6多了三个选项。

 

-Ofast:启用-O3的所有优化,以及其他可能违反语言标准(严格遵守)的优化。

 

-Os balanced:平衡代码大小与代码速度。默认情况下,编译器执行优化以提高性能,但可能会增加image文件大小。

 

-Oz image size:优化代码大小。

 

3如何优化?

本节讲述三种编译优化,使其达到最优(代码最小、性能最好)

  • 代码大小

  • 代码性能(速度)

  • 代码平衡(大小和速度)

 

1.优化代码大小

针对AC5编译器:

  • Use MicroLIB

  • Use Cross-module optimization

  • Optimization:level 2 (-O2)

 

针对AC6编译器:

  • Use MicroLIB

  • Optimization:-Oz image size

 

说明:

A.代码量大(ELF代码段通常包含许多函数的代码),可考虑使用The One ELF Section per Function选项减小代码。

 

B.AC6编译器改进了优化功能(可以理解为增加的3个选项集成了优化功能)。

 

代码优化大小(对比):

 

2.优化代码性能

针对AC5编译器:

  • Use Cross-module optimization

  • Optimization:level 3 (-O3)

  • Optimize for Time

 

针对AC6编译器:

  • Optimization:-Ofast

  • Link-Time Optimization

 

代码优化性能(对比):

 

3.代码平衡

这种情况下,在满足代码大小的同时,我们应尽量满足性能。

 

这里其实就是一个相关平衡的关系,结合上面两种优化方式根据自己实际情况出发,一般优化考虑如下配置。

 

针对AC5编译器:

  • Use Cross-module optimization

  • Optimization:level 3 (-O3)

  • Optimize for Time

 

针对AC6编译器:

  • Optimization:-Os balanced

  • Link-Time Optimization

 

当然,AC6中-Os balanced优化选项更智能。

 

4拓展说明

MDK-ARM的优化功能需要结合项目实际情况进行优化。对一些项目能起到很大帮助作用,但优化之后也可能带来一些影响。

 

1.使用高度优化(-O1以上),可能会影响Debug调试(因为优化之后,编译输出和实际代码不匹配)。

 

2.指定源文件/文件组优化

有些代码不需要优化,我们优化指定的源文件/文件组就行。

 

 

推荐阅读:Keil系列教程

 

5最后

我的知乎:strongerHuang

我的网站:www.strongerhuang.com

 

若觉得文章对你有帮助,随手点赞、分享,也是对我的支持和鼓励。

 

关注公众号『strongerHuang』,在底部菜单中查看更多精彩内容!

 

长按识别图中二维码关注

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值