自动驾驶perception模块orin vs 3090 benchmark

最新推荐文章于 2024-07-12 13:13:38 发布

闽C最后的深情

最新推荐文章于 2024-07-12 13:13:38 发布

阅读量806

点赞数

文章标签：自动驾驶人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35224427/article/details/129222156

版权

[概述]最近在移植了apollo工程到orin上后，主要做了一些benchmark，主要是localization模块和perception模块，因为这两个模块都有使用GPU。

模型转换

做这个benchmark前期主要除了工程移植以外。还有要做模型的转换，把模型转换成orin上使用的engine。

这里使用的是trtexec工具以及代码转换，主要要注意的是一些自定义层的问题，由于模型会涉及一些自定义层，所以在转换的时候要把相应插件动态库load进去或者修改trtexec源码，增加对应的插件部分。

测试结果

在我测试的模块里，perception主要有maskrcnn，pointpillar以及centerpoint三个模型，由于信息安全问题，我不便详细讲每个模型的具体数据表现，总体情况，整个pipeline orin上的latency大概是3090的1.75倍，但是orin的gpu使用率比较高，几乎打满，3090的大概在60%左右。可以供各位做一个参考，这里记录一下。

闽C最后的深情

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

闽C最后的深情 CSDN认证博客专家 CSDN认证企业博客

码龄8年

8: 原创

52万+: 周排名

161万+: 总排名

5127: 访问

: 等级

115: 积分

125: 粉丝

3: 获赞

29: 评论

19: 收藏

私信

关注

热门文章

最新评论

Apollo 自动驾驶工程 x86迁移到ARM ORIN
小明GUIDEME: 打拼的泉州人
orin模组和x86 cpu pcie带宽延迟测试
weixin_53009864: 请问一下，这个pcie虚拟网卡为什么带宽这么低，正常8lane带宽应该64Gb吧
Apollo cyber 在orin平台编译优化等级崩溃问题排查
CSDN-Ada助手: 恭喜您撰写了第8篇博客！标题看起来很吸引人，对于Apollo cyber在orin平台编译优化等级崩溃问题的排查，您的经验和见解一定会对读者有所帮助。希望您能继续保持创作的热情和努力，继续分享您的技术心得和解决问题的方法。在下一步的创作中，或许可以考虑将问题排查的过程更加细致地呈现出来，分享您的思考过程和解决方案的选择依据。这样读者可以更好地理解您的思路，也能从中获得更多启发。同时，也建议您多与其他领域的专家进行交流和讨论，融合不同的观点和经验，进一步提升博客的深度和广度。再次恭喜您，期待您未来更多精彩的创作！
对于在英伟达JETPACK平台容器内使用cuda以及编译apollo工程的问题
a1079449170: 请问下大佬localization和perception是怎么编译的，想在orin上部署apollo，现在就剩这两个没有编译成功
自动驾驶中localization模块latency延迟过大问题排查
CSDN-Ada助手: 非常感谢用户的分享，阅读了您的博客后收获颇丰。恭喜您能够深入分析自动驾驶中localization模块latency延迟过大问题，并有针对性地提出排查方案。希望您能够继续坚持创作，分享更多有价值的经验和知识。我建议您可以在之后的博客中，结合实际案例或者是新的技术研究，为我们带来更深入、更有启发性的内容。祝您创作愉快！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。