判断图像局部过暗_基于图像的三维模型重建——稠密点云重建

  • 稠密点云的获取方式
    • Lidar 扫描
    • Kinect
    • 结构光
    • 基于图像的方法-Multi-view Stereo
  • 基础知识
    • 极线条搜索
    • 光度一致性约束
    • 可视性约束
  • 多视角立体技术
    • 基于体素的方法
    • 基于空间patch 的方法
    • 深度图融合

一、稠密点云的获取方式

  • Lidar扫描:精度高(毫米级别),效率高,有效范围几米到几百米,价格昂贵;高反光,玻璃表面,吸收表面

555e938ede49ce537af8dacf0afa0a60.png
  • Kinect:使用方便、价格适中、速度较快;精度较低、有效距离短

7512268c6ad28fb55cb6b1c065e0a795.png
  • 结构光:高精度、高效率、近距离数据获取

d3160648a01eecb23e25673d92b50306.png
  • 基于图像的方法:multi-view stereo,无源被动式、成本低、图像来源广、计算速度慢、精度较高

7798d8fb65bd90704e1706a2e8a2f4c9.png

二、基础知识

1.极线搜索:参考图像中的一点对应另一幅图像中的一条线段

df7f3027051e992474ee6aa8eed20c23.png

2.光度一致性假设 photo-consistency

  • 同一空间的点在不同视角的投影应当具有相同的光度,重建的核心在于恢复空间中具有光度一致性的点
  • 朗伯反射假设:

cc8114693c49df41c78158476fa89782.png
  • 常用的计算区域广度一致性的度量方式:
    • Sum of Squared Differences (SSD)
    • Sum of Absolute Differences (SAD)
    • Normalized Cross Correlation(NCC)

3.可视性约束

  • 图像中出现的点不能被遮挡
  • 重建的点前面不能出现点
  • 不能出现在物体内部

bd4a2beae39e4ff4a5a9a9d94bf3b5d9.png

三、多视角立体技术

1.基于体素的方法

  • 规则的划分[1]:等价于3D空间Voxel标记的问题

e8c09e336cd7bba326a070c5ec4a4469.png
  • 不规则的划分[2]:等价于3D空间四面体标记的问题

5df530e3916c7613d1e7be8567da5439.png
  • 图像上的约束——剪影约束

85cd492e488ff03d7bb3cac573320d6e.png
  • 图像上的约束——光度一致性约束

ad4030faac8a32706fb75b53233d7720.png
  • 常用的优化模型[3]——典型的MRF离散优化问题
    • 参考图像上每个像素分配一个标签(内部或者外部)
    • 数据项-光度一致性假设
    • 平滑项-邻域假设
    • 可视项-可视性约束

8f0e3b90336167c5ac4e73d1011b48bd.png
  • 优缺点
    • 优点
      • 生成规则的点云
      • 便于提取物体的平面
    • 缺点
      • 精度受到空间划分分辨率的影响
      • 难以处理精度高、规模大的场景

2. 基于空间patch扩散的方法

  • 方法
    • 假设空间中的3D 矩形patch
    • 通过一定规则的扩张方法,使得patch覆盖物体表面
    • PMVS http://www.di.ens.fr/pmvs/

99f1d1c734815191524bb6b9eba100dd.png

5931c4e2156f02e807362843f80191ca.png
  • 流程

8f120445114d807e50b53a0f92541314.png
  • 初始3D patch的生成

b72103656a852203b2c951a56caadc4d.png
  • patch扩张

1a7d25afce2dff121c42681cf4eb8135.png
  • patch滤波

7c36ad9a7654311adb19e3fe06c00a56.png
  • 特性

b1080f724412438e6107b1c39de08a13.png

7966383f886ade155718fc5c026d4036.png

d0b2ab20246c8439b8c77b160c5b4438.png

3.基于深度图融合的方法[4]

  • 人的左右眼立体视觉和深度图

e4a44e885f622953a3a8028d346cc889.png
  • 基本流程
    • 1. 为每一幅图像选择邻域图像构成立体图像对
    • 2. 计算每一幅图像的深度图
    • 3. 进行深度图融合
  • 视角选择

e70010fce1ca6f048978ab995ef3577c.png
  • 邻域的选择——全局视角选择
    • 1. 图像具有相同的内容、外观和尺度
    • 2.图像具有足够大的时差(宽基线)

892fd660ace0547f26f3b0c5d52f7a3f.png

0ceb1a5ef0a396eabb15bcd4a55f5298.png
  • 图像尺度的估计——用于衡量图像的分辨率
    • 图像上1个像素的宽度对应的三维空间中的物体尺寸

f1c881436562da8005b2ef6b2fc0332a.png
  • 相关视角的选择——局部视角选择
    • 1.NCC值确定候选视角
    • 2.实现要足够分散(不共面)

25d2a37f4ccb2c45b192d34581cb1377.png

caa7a529895a63fad0df5fab4979a8c5.png
  • 区域生长法扩张
    • 重建的置信度建立优先级队列
    • 从初始的稀疏特征点开始深度估计
    • 对每个种子点进行非线性深度优化
    • 每次优化完后判断以下两种情况,将邻域像素添加到队列中: 1)邻域没有深度值 2) 当前像素的置信度值高于邻域像素一定范围

d6e3c94fffcd073612a61efb8611ee7e.png
  • 深度值非线性优化

770e9ed203da0b5ba9fb703232d0e847.png
  • 深度值非线性优化

db563b493fd581cb14c5a359ef124cc4.png
  • 非线性优化的数学模型

06a22929fd7001babf9136f59aca48e0.png
  • 颜色尺度的优化

2716df12ba7be167d6ee95ee47ab78f2.png

最小二乘法

419f0f49e3be53e3679af7bf75aaaf15.png
  • 的优化-梯度下降法

eec8f9be11c796531d2557e843580a35.png

3b004da25d672707cc2e9c784caea9da.png
  • 深度值非线性优化——整体框架
    • 只进行深度h(s,t)的优化(迭代4次)
    • While (迭代次数< 20)
    • 每间隔5次迭代,进行 h(s,t), hs, ht的优化,否则仅优化深度
    • 优化完成后跟踪判断每个视角的置信度
    • 如果视角的置信度太小,或者超过迭代14次尚未收敛,则从局部视角中移除该视角,并重新进行视角选择
  • 深度估计结果

5705a9d03094a942c027ca7c59fd2fd3.png
  • 深度融合

88926759257973ee293fb2355815e75a.png
  • 深度融合——一致性约束

b23e5e6b1e4d28d5b700804b43d998de.png

4c374a3933c707dc4196b017b4dc0222.png
  • 深度融合——可视性约束

a07b8dcc90bd374ba4ca3c5bbc6a1bc8.png
  • 总结:
    • 邻域视角选择使得深度估计准确度提升
    • 原理简单,只用到光度一致性约束和可视性约束,适用的场景广泛

a31a16b532d8ffb0449cf83c695d5c5b.png

参考

  1. ^S.M. Seitz and C.R. Dyer. Photorealistic scene reconstruction by voxel coloring. International Journal of Computer Vision, 35(2):1–23, November 1999.
  2. ^Sinha S N, Mordohai P, Pollefeys M. Multi-View Stereo via Graph Cuts on the Dual of an Adaptive Tetrahedral Mesh[C]// IEEE, International Conference on Computer Vision. IEEE, 2007:1-8.
  3. ^V. Kolmogorov and R. Zabih. Multi-camera scene reconstruction via graph cuts. In European Conference on Computer Vision (ECCV), 2002.
  4. ^M. Goesele, N. Snavely, B. Curless, H. Hoppe, and S. Seitz. Multi-view stereo for community photo collections. In IEEE International Conference on Computer Vision (ICCV),2007.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值