MegBA A High-Performance and Distributed Library for Large-Scale Bundle Adjustment

最新推荐文章于 2024-07-10 21:56:17 发布

翡翠之幻

最新推荐文章于 2024-07-10 21:56:17 发布

阅读量605

点赞数

文章标签：矩阵线性代数深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40268190/article/details/122858386

版权

基于多GPU的BA算法，有三个创新点：

对于整个BA流程进行了矢量化（Vectorised），使其满足并行化计算的需求。
在多个线程之间进行了合理的工作量分配，同时保证了优化结果的最优性。
API和主流的优化库g2o和ceres兼容。

基于SIMD优化的矢量化BA

将BA流程特别是PCG的过程都通过SIMD进行优化。

分布式BA

基于边的工作分配

根据边的数量还将雅可比矩阵分为若干块 $J=[J_1 J_2 \dots J_3]^T$ ，在后续的海森矩阵计算和舒尔补中也体现了这一点。

多线程同步

在矩阵计算和PCG过程中保持同步。

其他优化

GPU显存优化

估计后续矩阵微分需要的显存，避免频繁的显存分配。
在多个GPU线程中共享对于雅可比矩阵等变量的存储。

兼容和可拓展的API

在BA问题的声明和BA求解器的选择上，兼容现有优化库。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
MegBA A High-Performance and Distributed Library for Large-Scale Bundle Adjustment

基于多GPU的BA算法，有三个创新点：对于整个BA流程进行了矢量化（Vectorised），使其满足并行化计算的需求。在多个线程之间进行了合理的工作量分配，同时保证了优化结果的最优性。API和主流的优化库g2o和ceres兼容。基于SIMD优化的矢量化BA将BA流程特别是PCG的过程都通过SIMD进行优化。分布式BA基于边的工作分配根据边的数量还将雅可比矩阵分为若干块J=[J1J2…J3]TJ=[J_1 J_2 \dots J_3]^TJ=[J1J2…J3]T，在后续的海森矩阵计算
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。