我读Fine-Grained Change Detection of Misaligned Scenes with Varied Illuminations

背景介绍

文章标题:Fine-Grained Change Detection of Misaligned Scenes with Varied Illuminations,ICCV 2015,暂无主页,PDFCode&Dataset1

本文贡献

所有的变化检测都是针对大尺度、且识别的主体具有显著性的图片进行检测,本文提出的方法可以在毫米级别对差异进行检测。本文起点是相机已经对同一场景拍摄了两组照片2,每组照片相机参数不变,环境光变化。这样子变化检测就可以认为只由一下三个方面影响:

  1. 环境光
  2. 相机+镜头的几何畸变
  3. 被拍摄物体的真实变化

本文就针对以上三点提出了一种从粗到精细、最终使用最小化rank进行变化检测的方法。

实现方法

在讲述方法前,先回顾一下本文目标、前提条件、以及难点。目标是做精细的变化检测,前提条件是相同位置拍摄的两组图片,且两幅图片位置相差几乎很小,每组照片有 K+1 幅图像构成,分别为单纯环境光,与加上了 K 个方向的有向光拍摄,这样子好处就是可以对细微变化检测(并且简单方便够便宜)3,见图1。
图1

难点就是上面说的三个影响因素,我们记一下符号表示:

意义 符号
上一次的照片组 X,每一列为一幅图片 这一次的照片组 Y ,每一列为一幅图片 环境光不同 L 相机+镜头的几何畸变 F 真实场景的变化 C

本文使用到的方法是coarse-to-fine的方法迭代的对上面的三个影响因素求解。为保证结果的准确性,先简单介绍了一下相机重定位的原理。整体流程见图2。

图2

1. 数据采集

就是相机重定位的过程,假设上一次拍了一组照片 X ,这次需要排到几乎相同位置的一组照片 Y ,相信很多有摄影经验的人都知道这是很困难的,因为手抖一下相片都会模糊,这时隔好几个月或者一年的两张照片怎么能一样。这里我们通过不断的调整相机的姿态完成,使用到了单应矩阵(homography matrix),假设上一次拍的图片是 Rb ,这一次当前图片 Rr ,相机姿态是 Ic ,我们有单应矩阵使得 Rr=HRb ,通过单应矩阵 H 来调整相机姿态是 Ic ,循环拍摄-调整几次之后我们就得到了一个基本相同的 Rb Rr

2. F 的初始化

因为 X Y 中图片的光照是一一对应的,可以先假设有一个全局的环境光打在一幅图片 xiR3×N 上,形成 Aixi+bi ,即 yi 的近似。其中的

[A^i,b^i]=argminAi,bi||Aix~i+biy~i||2F

其中 x~i y~i 是SIFT匹配点对的RGB值形成的矩阵。这个方程就是一个最小二乘法求映射的,把 X 转化为了 XF

3. Normal-aware lighting correction

上小节假设加的是全局环境光,本小节假设加了局域光,用到Lambertian reflectance model,对每个像素 p ,有Ip=np,ωρpL(ω)dω。就是像素在照片上显示的颜色=物体与发现夹角余弦 × 反射率 × 入射光。加了一个局域入射光,就变成了这个样子:

xLFp=np,ωρp(Lx(ω)+Lv(ω))dω=xFp+Lvp=yp

第二个等号后面,第一项 xFp 是上小节处理过后的图片的像素 p 位置的值,第二项Lvp是文章假设局域光对像素点的影响。
Li=argminLvp(xiFp+Lvpyip)2exp(Cpσ)+αpqωpq(LvpLvq)2

第一个求和符号保证的是拟合程度高,其中 Cp 表示上次检测时,此像素变化情况,如果接近1则表示上次变化很大,进而 exp(Cpσ) 接近于零。也就是说,对于变化区域不用追求光照一致化,免得光照矫正把微小变化给搞没了。
第二个求和符号项鼓励局域光平滑性好。 pq 表示相邻的像素, ωpq 就是两个像素的相似度,求法是使用色度(照片颜色除以光强)。
于是我们得到局域光调整过后的图片 XL

4. 相机几何校正

引用自Sift flow: Dense correspondence across scenes and its applications,改了一下能量方程:

E(F)=i,p||xiL(p+Fp)yi(p)||1exp(Cpσ)+βp||Fp||22+pqmin(γ||FpFq||1,d)

具体实现可以看一下被引用的文章 4。本文里说使用1小节中的方法就可以初始化 F 了。
此步骤后图片的标记变为 XLF

5. Low-rank变化检测

重点来啦,各位请打起精神,这一节我们就会得到一个变化概率图像。
首先,两组图像根据环境光两两匹配,对第i对图像我们就有两列矩阵 Oi=[XiLF,Yi] ,第一列是上一节处理图像(拉长变成了一列),第二列为本次拍摄的图片。于是有 O=[O1,...,OK+1]R3N×2(K+1)

然后建立了目标方程:

argminZ,E||Z||+λ||E||1+κ||TE||2Fs.t.O=Z+E

Z 表示不变部分, E 表示非常离散的变化部分, T=diag(A,A,A) 表示像素的相邻关系,如果两个像素 pq 相邻,有 App=Aqq=1,Apq=Aqp=1 ,使用拉格朗日乘子法,目标方程变为:
argminZ,E||Z||+λ||J||1+κ||TE||2F+Φ(Y1,OZE)+Φ(Y2,YE)

稍微解释一下, Y1,Y2 是拉格朗日算子, Φ(Y,Z)=μ2||Y||2F+Y+Z ,使用ALM算法求解 5[^cite3]。

最后把 E 取平均值得到差异概率矩阵 C

6. Coarse-to-fine优化以及最终结果

图2很直观,差不多3到5个循环3-5小节的步骤就能结果收敛,这时候简单的对 C 一个阈值分割就可以得到结果,本文却没这样做。而用了金字塔模型构造了所有层的平局值 Call ,然后用线性SVM分类,像素特征是周围 7×7 网格的线性排列。这样就有了最终结果。

实验结果

颐和园数据集 Dp

MethodF1RePrSpFRRFNRPWC
SC_SOBS A0.030.900.010.090.910.1089.80
SC_SOBS M0.020.970.010.030.970.0396.21
SC_SOBS LFA0.110.340.060.950.050.665.62
SC_SOBS LFM0.160.200.140.990.010.801.92
SubSENSE A0.020.550.020.600.400.4539.41
SubSENSE M0.020.930.010.200.800.0778.85
SubSENSE LFA0.080.040.050.990.010.961.81
SubSENSE LFM0.070.220.040.950.050.785.85
Ours (D&T)0.340.280.521.000.000.720.92
Ours (SVM)0.510.530.470.990.010.471.02

实验室内壁画试块数据集 Db

MethodF1RePrSpFRRFNRPWC
SC_SOBS A0.030.310.020.690.310.6931.52
SC_SOBS M0.030.360.020.650.350.6435.07
SC_SOBS LFA0.020.020.030.990.010.981.99
SC_SOBS LFM0.090.080.140.990.010.922.01
SubSENSE A0.240.500.310.720.280.5028.32
SubSENSE M0.230.670.190.660.340.3334.01
SubSENSE LFA0.060.030.261.000.000.971.43
SubSENSE LFM0.280.210.500.990.010.791.62
Ours (D&T)0.450.400.561.000.000.601.23
Ours (SVM)0.530.620.480.990.010.381.41

雕像数据集 Ds

MethodF1RePrSpFRRFNRPWC
SC_SOBS A0.010.590.000.780.220.4122.29
SC_SOBS M0.010.660.000.730.270.3427.41
SC_SOBS LFA0.190.340.141.000.000.660.31
SC_SOBS LFM0.270.440.191.000.000.560.24
SubSENSE A0.020.830.010.880.120.1712.13
SubSENSE M0.010.980.000.660.340.0234.28
SubSENSE LFA0.270.280.340.990.010.721.57
SubSENSE LFM0.120.770.070.950.050.235.37
Ours (D&T)0.530.780.431.000.000.220.28
Ours (SVM)0.510.860.391.000.000.140.29

金字塔模型不同层数的 F-1 measure

Dataset1 Level2 Levels3 Levels
Dp 0.35950.44760.5134
Db 0.39070.48970.5254
Ds 0.42360.67370.5118

ROC曲线


  1. 这篇文章主要作者均为本人研究生所在项目组人员,一作是小编的导师,二三四作是师弟,五作是师娘,六作为项目负责人。本项目源自敦煌研究院联合天津大学共同完成的一个文物保护项目,本项目的目标是对敦煌壁画进行病害监测,部分内容涉密。
  2. 共分为两步,粗定位和精细定位,粗定位的两种方法已经申请发明专利,精细定位方法涉及多极几何,软硬件均为本文作者与孙高工、岳师弟共同完成。
  3. 另外一种对细微变化检测的方式是使用相机从多角度拍摄后3D建模,但是多光照和多相机姿态太太太具有挑战性了,并且3D建模的变化检测结果误差太大(不能保证pixel-level的检测,你懂的)。
  4. Liu, Ce, Jenny Yuen, and Antonio Torralba. “Sift flow: Dense correspondence across scenes and its applications.” Pattern Analysis and Machine Intelligence, IEEE Transactions on 33.5 (2011): 978-994.
  5. Lin, Zhouchen, et al. “Fast convex optimization algorithms for exact recovery of a corrupted low-rank matrix.” Computational Advances in Multi-Sensor Adaptive Processing (CAMSAP) 61 (2009).
    [^cite3]: Liu, Guangcan, et al. “Robust recovery of subspace structures by low-rank representation.” Pattern Analysis and Machine Intelligence, IEEE Transactions on 35.1 (2013): 171-184.
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值