泊松图像编辑/融合(Possion image editing)的原理与数值解算法

泊松图像融合是目前融合算法的标杆,泊松图像编辑不仅可以用于图像融合,还可以用于风格迁移、插入透明物体、局部亮度/颜色调制等。网上有不少介绍泊松图像融合算法的文章,但基本表都刻意淡化了其理论推导,着重去讲其实现,让人读完还是只知其然而不知其所以然,甚至连知其然都做不到。这里我将尝试从原理到实现系统地讲一讲泊松图像编辑/融合技术。(注:本文源于对http://www.ipol.im/pub/art/2016/163/上“Possion image editing”论文与源码的解读,读者可以自行从上面下载论文和代码)

泊松图像编辑的原理说来也不复杂,其实就是在满足一定边界的条件下让待求解二维函数f在区域\Omega中的梯度场与参考梯度场\boldsymbol{\mathbf{v}}尽可能相似,这种相似度最大化用差值的二阶范数最小化来表征,而这个边界条件就是函数值在边界上与目标图像f^{*}的的取值相等,这就是所谓的狄利克雷边界条件。用数学方式表示就是:

 其解满足欧拉——拉格朗日方程:

该方程就是所谓的泊松方程。关于散度的理解可以参考https://blog.csdn.net/weixin_41923961/article/details/85225757。对于\Omega与图像外边缘\partial R相交的特殊情况<注:对此特殊况不感兴趣的可以直接跳过>,狄利克雷边界条件被\Omega \cup \partial R上的纽曼边界条件(即边界处导数为0)替代,也就是相当于对图像进行了边缘复制性外扩。

前述泊松方程的矩阵表示为:

 其中,D_xD_y的形式与我先前的博客https://blog.csdn.net/u014230360/article/details/107639764里的相似,但\Omega以外区域的对应行都是零值行!fv_xv_y分别是待求解图像、参考梯度场x分量、参考梯度场y分量的向量化表示。以一个4*4的图像示意,拉普拉斯矩阵L的形式如下图所示(第一行两个1的外框颜色反了,图是从论文中截取的)。

也就是说,L在\Omega与图像外边缘\partial R不相交的时候,L中对应于\Omega的每一行的非零元素都是1、1、-4、1、1(注意,是对应于\Omega的行才是非零行!)。当出现\Omega与图像外边缘\partial R相交的特殊情况时,由于交集上的点的像素值由\Omega上的点的像素值复制而来,此时中对应坐标的Z值被Z_{x,y}替代,也就出现了上图中的情况。

\Omega的投影矩阵如下式所示(N=H*W,等于<边界外扩后的>图像的总像素数):

 即只有对应\Omega中某点的行在主对角线上有一个值1,其他行均为零值行。

 同样,记\Omega的外边界\partial \Omega的投影矩阵为:

记对\Omega中点进行采样的采样矩阵为:

 对P_\OmegaP_{\partial \Omega}S_{\Omega}的解释见下图(注意图中边界的外扩!):

于是有f=(P_{\Omega}+P_{\partial \Omega})f,继而有:

最后一步中还是一个关于N个未知数的N维方程组,但实际上真正与问题相关的的未知数只有n个(n对应\Omega中的像素点数)。用采样矩阵S_{\Omega}作用于其上,得:

其中,x是对应于 \Omega中像素点的nx1的列向量。

以上便是用于求解目标图像\Omega中像素值的形如Ax=b的方程。解出x=A\setminus b,用\Omega对应的值取代目标图像中的相应值即完成泊松编辑。

当区域\Omega是一个矩形区域时,关于泊松方程的求解还有一个更高效的基于傅里叶变换的实现,以后有时间我再讲一讲。感兴趣的同学暂时可以参照http://www.ipol.im/pub/art/2016/163/的论文和代码自行研究。

效果图就不放了,网上一搜一大堆,论文中也多的是。

  • 6
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值