动态内存分配导致的性能问题

最新推荐文章于 2023-04-14 14:09:47 发布

我的国

最新推荐文章于 2023-04-14 14:09:47 发布

阅读量995

点赞数 2

分类专栏： linux性能优化文章标签：性能优化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/renjianhhong/article/details/129198338

版权

linux性能优化专栏收录该内容

6 篇文章

订阅专栏

文章指出在QNX系统中，动态内存分配由于全局锁的存在导致高并发时性能下降，表现为频繁的锁竞争和CPU占用。通过分析tracelog，发现在1camera情况下，每秒内锁的争用超过一万次。锁抢占不仅引起任务延迟和线程切换，还会导致CPU占用过高。通过内存缓存策略（MEMORY_HOLD=1）和使用tcmalloc可以优化性能，但前者可能导致内存泄漏，后者可能带来技术风险。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在QNX系统上，动态分配内存效率极低，进程内各个线程分配内存时，都会先去拿一把公共锁；由于本身的低效，全局锁，以及强优先级调度的机制，内存分配过多将成为系统性能的瓶颈；

通过抓取实车运行的tracelog，我们统计到目前1camera情况下，由于多线程并发malloc导致的严重锁竞争情况，mutexlock(ptr=0x10afb38)平均每秒进入内核的次数超过1万；附件：

锁的抢占一方面，会导致任务的延时，并造成频繁的任务调度。下图可以看到下面几个线程，出现了严重的锁竞争情况，导致任务的延时和频繁线程切换；

锁抢占另一方面，会导致严重的CPU占用问题。QNX提供的libc，在获取锁时如果拿不到，会以spintrylock自旋方式重试10次，这期间一直占用着CPU，如下图

QNX的强优先级机制，如果当前拿不到锁，而且如果锁当前被同一个CPU上的线程占用，则spin10次也是徒劳，只能等尝试失败后进入Mutex等待态；

调用栈：

验证

通过配置MEMORY_HOLD=1的malloc选项，让free的内存永远不还给操作系统，尽量多的缓存到用户层，发现全系统的性能可以有较大的提升，从原来的1~2fps提升到9fps；但是这种方式会导致内存泄露，只能当成临时的手段walkaround；

通过使用tcmalloc替换libc的malloc，也基本可以达到同样的优化效果；tcmalloc QNX官方不支持（可提供独立的付费支持），存在一定的技术风险；

博客等级

码龄13年

85
原创

47
点赞

141
收藏

30
粉丝

关注

私信

热门文章

分类专栏

汽车电子 1篇
自动驾驶 8篇
linux性能优化 6篇
linux基础 4篇
opengl 1篇
Android 117篇
NODEJS 2篇
QT 2篇
JAVA 5篇
GIS 2篇
NDK 4篇
阿里云 1篇

最新评论

C++写一个简单的状态机实现
barbyQAQ: 真tm简单
C++写一个简单的状态机实现
henysugar: 使用AI，浪费资源啊
如何训练一个模型
普通网友: 作为深度学习从业者，我可以很明确的说，跑训练这个事情，必须得有一个好的显卡，别人10分钟能跑完的任务，你这里需要跑一个小时，在这个过程中别人已经调优了好几轮了，效率提不上去的话根本没办法和其他人竞争，哪怕是没有钱买好的卡，租一张也行呀，我就是找了几个平台，autodl，inscode和炼丹侠去租的A100，跑训练的时候比我本机快了将近10倍，而且调优之后启动也特别快，炼丹侠还有免费试用活动，我是觉得用租卡的钱换节省的时间很值
Perf火焰图生成及分析
CSDN-Ada助手: 不知道 CS入门技能树是否可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
WebSocket实现Android客户端之间的简单通讯
stronger007: 楼主，http://autobahn.ws/android/downloads/这个链接失效了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。