[第二期]彻底搞透视觉三维重建:原理剖析、代码讲解、优化改进视频课

前言

在这门课程二期开课之前,我想说些心里话。时间飞逝,第一期课程的启动是2021年3月份左右,时至今日,已满三载有余,感概万千。这三年里面三维重建出现了各式各样的发展:nerf、gaussian splatting等,这些技术的出现无疑是对传统3D视觉的巨大冲击,但目前来看,大多数nerf和gaussian splatting 的输入还都是sfm的结果,根据开源的结果来看准确的说应该是使用colmap的结果作为输入,当然也有一些工作是without colmap的(目前并不多)。显而易见,传统的mvs的道路正在走向泯灭的路途中,而sfm这一个重要的环节何事会何时被新技术完全替换,我想应该在不久会出现,但是目前来看传统的sfm技术还扮演者一个重要的角色。

图片

谈起sfm的作用(排除做类似photoscan、contextcapture的产品),目前除了提供给nerf和GS的输入之外,在AR领域也发挥着一个重要的作用-map-based 视觉重定位。我们都知道所有的结果都是有痕可寻的,这句话同样适用于colmap的sfm结果,一旦发现最终的结果不尽人意,都会归因为输入的质量不佳。所以单纯的git clone 来使用是远远不够的,要结合大量的经验来优化,这样才能起到事半功倍的作用。

图片

关于二期课程的迟到,在一期结束后有粉丝朋友和相关人员一直在期待第二期,因为工作和生活原因,这一拖便是三年。这三年我也是在AR行业摸爬滚打的重要的时间段,也是自我沉淀和复盘的关键期。对于二期课程的内容我想分享的很多,这些知识点也是我觉得目前市面上公司最需要的。

图片

课程大纲

图片

差异化体现

二期课程在内容上相比一期增加了不少知识,本来我列得更多,如分组sfm、多相机sfm、二维码、平面sfm等等。但是考虑到如果原本的sfm都不够鲁棒,做分组这些工作都是无意义的,分组sfm的稳定的前提是local sfm足够awesome。因此目前课程的内容相比于一期有以下增加:
1.long-term feature sfm:这个内容主要是针对空间计算,视觉定位要满足不同季节、不同时间段等的要求,handcrafted feature 很难达到效果。
2.view graph 优化:sfm算法的稳定性很大程度上依赖于匹配连接图的稳定性。

图片

图片

3.多模态数据的融合:数据源除了RGB图像以外,现在不少sensor都可以拿到depth 信息或者激光测距信息,这些信息完全可以融合到sfm中。
4.先验地图的定位:是AR的核心,这个话题要完整的论述需要长篇大论,所以二期课程这里只是基于colmap本身的sift来实现,里面也会有一些不少的tricks。
5.相比于colmap的incremental sfm 而言,其框架不具备全局和全景的功能,二期加入全局和全景的知识是具备潜在的目的和意义:

  • 目前不少用户的数据都是forward motion case ,特别是特斯拉4D 时空数据标注的出现,目前很多自动驾驶公司都在使用这一方案。这种类型的数据处理比较困难,而gsfm和isfm如何结合构建hybird便可处理此问题。

  • 全景数据的处理也是目前做的比较多的工作,而处理方式和技巧也需要大量的经验。

图片

综上,总体而言,二期课程核心剑指原框架的不足,二期增加的所有内容都是原框架没有的,主要目的是为了提高鲁棒性和准确性

:本课程依赖仓库:https://github.com/yuancaimaiyi/colmap-fusion-gps(为融合gps完整版代码,含有注释)

适合人群

1、理工科相关专业,熟悉三维重建、线性代数、概率论等相关理论知识、有一定c++、python编程基础;
2、已经入门三维重建研究领域的本科、硕士及博士研究生;
3、希望通过此课程能够快速实现三维重建算法,并能在项目中应用的研究人员。

学后收获

1、掌握视觉三维重建整个流程,对colmap框架有深刻的理解,同时对于其他框架也能较快的入手
2、掌握多视图几何算法、光束法平差以及各种改进如融合gps、融合深度信息、多源数据处理等等
3、锻炼举一反三的能力,将colmap中优秀的算法应用到其他地方,如gaussian splatting、AR视觉定位等
4、形成工程化思维,将colmap开源框架进行优化形成一个完整的产品
5、学会借鉴其他开源框架的优点,如openmvg、opensfm等,将其里面较新且优秀的算法集成到colmap中

开课时间

2024年6月16日晚上8点(周日),每周更新一章节。

课程答疑

本课程答疑主要在本课程对应的鹅圈子中答疑,学员学习过程中,有任何问题,可以随时在鹅圈子中提问。

图片

▲长按购买课程,前50名

享早鸟价,立减100元

图片

▲长按添加小助理微信

cv3d007,咨询更多

备注:以上图片和视频部分来自网络,如果侵犯了您的权益,还请联系删除!

  • 8
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
三维重建是通过使用一定数量的二维图像来恢复或重建三维物体表面的过程。它旨在通过从不同角度观察物体并分析图像的视觉几何关系,得到物体的三维模型。 在进行三维重建时,视觉几何原理扮演着重要的角色。视觉几何原理是指通过分析不同视角下图像之间的位置和姿态关系来推断过程中物体的几何特征。这些几何特征包括物体的位置、大小、形状和姿态等。 OpenMVS(Multiple View Stereo, 多视图立体重建)是一种常用的三维重建库和工具,用于生成高质量的三维点云和表面重建。 OpenMVS使用一种称为 "多视图几何" 的方法来执行三维重建。这种方法通过根据从不同视角的图像中提取的特征点和它们的深度信息来估计物体的三维结构。OpenMVS通过三个主要步骤来实现三维重建: 1. 图像匹配:OpenMVS会分析输入的图像序列,找出特征点并计算它们之间的匹配关系。通过这种方法,它能够确定物体在每个图像中的位置和姿态。 2. 稠密点云重建:在确定图像之间的匹配关系后,OpenMVS会估计物体的精确三维点云。它使用立体匹配算法和多视图几何来计算每个像素的深度,并将这些像素转换为点云。 3. 表面重建:最后,OpenMVS通过把稠密点云转换为三角网格表面来生成最终的三维重建结果。它使用了一些表面重建算法,如Delaunay三角网格剖分和点云重建。 总结起来,OpenMVS利用视觉几何原理和多视图几何的方法进行三维重建。它通过图像匹配、稠密点云重建和表面重建等步骤,生成高质量的三维点云和表面模型。这种技术在许多领域,如计算机视觉、虚拟现实和机器人等中起着重要的作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值