STM32开启浮点运算单元FPU与DSP运算库，附性能测试+加减乘除耗时测试

暴躁的野生猿

已于 2025-04-25 11:46:34 修改

阅读量1.8w

点赞数 16

分类专栏： stm32/单片机文章标签： stm32 嵌入式硬件单片机

于 2020-11-27 10:19:26 首次发布

博主新建的qq群：1025127672，欢迎入群讨论

本文链接：https://blog.csdn.net/qq_31073871/article/details/110222039

版权

stm32/单片机专栏收录该内容

27 篇文章

订阅专栏

STM32F4xx属于Cortex M4F架构，自带FPU硬件，可以加速float类型数据的加减乘除运算。

观察启动文件，发现，要启用FPU，需要启动满足两个宏：(__FPU_PRESENT == 1) && (__FPU_USED == 1)

在keil的魔术棒中，如上图所示，直接选中单精度浮点运算器，keil就会自动把所需的宏给定义出来。如何验证是否开启成功？

验证方法1：

我们把F407主频设为168M，不选中/选中FPU，分别做10万次乘法：发现耗时分别为32153us、5954us，发现耗时缩短为1/6.性能提升显著，说明开启FPU成功了。

验证方法2：

进入debug模式，或者直接查看汇编文件，发现C语言乘法运算，被编译成了V打头的汇编乘法命令，说明开启成功。

FPU只能加速float的基本运算，还有一些数学函数，不是光靠FPU就能加速的，例如sin、cos、等函数，ST和ARM提供了优化过的三角函数等，使用插值方法加速运算，要想使用这些优化过的函数

-------------后记--------------------

再做几项计算耗时对比

图 A，耗时5952 us

图B 以上耗时7738us。该图比图A多了10万次乘法，时间多了1786us。

图C 耗时5952

图D 7738 us

图E 11309 us

图F 9524 us

图G 6547 us。和图A比，多了10万次赋值，时间多了595us

图H 15476 us

图I 9524us

图J 7143

图K 7738

图L 7143

总结：

图AG对比：10万次float赋值：595us （float赋值速度）
图AB对比：10万次float乘法、赋值：1786us
10万次float乘法：1786us-595us=1191us （float乘法速度）
图AC对比：10万次float加法和10万次乘法相同：1191us （float加法速度）
图AF对比：10万次float比较大小、赋值：9524-5952=5357us
图AH对比：10万次float除法、赋值：15476-5952=9524us
10万次float除法：=9524us-595=8929 （float除法速度）
图AI对比：10万次整数取模、赋值：9524-5952=3572us
图AJ对比：10万次整数加法、赋值：7143-5952=1191us
图JK对比：10万次整数赋值：7738-7143=595 （int赋值速度）
图AJK对比：10万次整数加法：1191-595=596 （int加法）
图JL对比：10万次整数加法和乘法，耗时相同=595us （int乘法法）

根据以上结果，得到以下重要的几个结论：

（1）float赋值和int32赋值速度相同

（2）float乘法和float加法，速度相同

（3）float乘法耗时是float加法的2倍；int乘法和int加法，速度相同

（4）float除法耗时是乘法的8倍，是加法的16倍

（5）float乘法耗时是int乘法的2倍

注意：以上测试赋值的过程中，使用了volatile，所以赋值时存在写内存的过程，如果没有volatile，赋值会被写入CPU寄存器，会比写内存稍微快一点点。所以以上测试是保守的，实际会更快。

暴躁的野生猿

博客等级

码龄10年

225
原创

3082
点赞

1万+
收藏

2万+
粉丝

关注

私信

分类专栏

qq联系方式or群号
操作系统 1篇
QT/安卓 1篇
QT 77篇
stm32/单片机 27篇
QT/QML 9篇
C/C++ 27篇
QT/QCustomPlot 7篇
QT/模型视图MVC 7篇
前端 11篇
QT/QChart 8篇
QT/样式表qss 11篇
QT/html 1篇
QT/3D 4篇
QT/lua 1篇
linux 23篇
linux/shell 4篇
linux/线程 6篇
linux/进程通信 6篇
linux/进程 1篇
网络 5篇
控制理论 18篇
惯性导航 7篇
matlab 14篇
数学基础 6篇
opencv 3篇
openGL 6篇
makefile 1篇
硬件 21篇
其他 4篇

最新评论

三维空间中的椭球拟合+磁力计校准算法+加速度计校准算法
yuchong2016: 有用！！！很棒！！！
用mission planner或者3drradioconfig软件配置X-ROCK数传电台
2401_89471394: 端口被关闭，大佬这个问题怎么解决
QCustomPlot系列(3)-用鼠标矩形框进行框选放大、右键平移
北极熊的奋斗史: 框选放大用自带的进行，esc取消功能自带函数写了，但是没有调用，重写下面的函数调用一下就行了 void QCustomPlot::keyPressEvent(QKeyEvent *e) { // 添加框选放大过程中esc取消的功能 if (mSelectionRect && mSelectionRect->isActive()) { mSelectionRect->keyPressEvent(e); } } 再该下面两个函数的内容，就没bug了 void QCPSelectionRect::keyPressEvent(QKeyEvent *event) { if (event->key() == Qt::Key_Escape && mActive) { // 这里直接调用自带的cancel函数 cancel(); } } void QCPSelectionRect::cancel() { if (mActive) { mActive = false; emit canceled(mRect, nullptr); // 这里重绘一下，不然会有残留框选虚线 layer()->replot(); } }
typedef的4种常见用法
kucoolbaby: 我认为下面这个写法是有点儿问题的： typedef __person person_t; _person只是一个结构体的标签，这个标签没有也可以，它不是类型，struct _person 才是类型，所以使用typedef进行类型替换时应该是 typedef struct __person person_t; 如果typedef后边不跟struct，那就和结构体类型没有关系了，是不是这样？
altium designer PCB各层介绍+添加多层+设置正/负片+设置层的网络标号
kk_max1996: “双击...，可以弹出网络设置框"

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。