[MGK∗19] 《Neural rerendering in the wild》(CVPR2019)阅读笔记（完）

lee2813

已于 2022-02-25 00:01:06 修改

阅读量1.8k

点赞数 2

分类专栏：论文阅读文章标签：人工智能计算机视觉论文

于 2022-02-17 16:38:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Tom870223050/article/details/122980596

版权

论文阅读专栏收录该内容

7 篇文章 1 订阅

订阅专栏

一、文献拟解决的问题

提出了一个完整的场景捕捉框架，利用网络上的图片进行一个大型建筑的全景捕获——重建和渲染
将输入的场景图像分解为视点，外观，语义标签，并依靠一个近似的几何代理，我们可以渲染出真实感的图像
与过去的一些方法的比较，提高了结果的真实性

效果展示：【Neural Rerendering in the Wild - CVPR 2019-哔哩哔哩】

二、分析的思路

（一）总览

首先，利用传统的三维重建方法（COLMAP）将场景重建为近似的点云数据，并作为几何代理。
然后，利用这个几何代理，学习点云中的场景图像到真实图像之间的映射，增强结果的真实性。

（二）神经渲染框架

在这里插入图片描述

（三）方法过程介绍

图示：
在这里插入图片描述
介绍：

1.关键结构

编码器Ea
输入：真实图像，包含图像信息的深度图（包括法线，反射率及其他信息）
输出：图像与深度图之间的配对数据
渲染网络R
输入：视点，图像与深度图之间的配对数据
输出：渲染结果

2.外观训练方法

第一步：预先训练编码器Ea，提高模型精细度。
第二步：训练渲染网络R
第三步：对两者进行联合训练

（1）网络设计
使用了BicycleGAN，附加了跨域损失计算，用于物体外观在不同视角下的转换。
（2）阶段性训练
简化了渲染网络，以及训练轮数
训练效果如下：
在这里插入图片描述
（3）预训练外观
在预训练外观阶段，我们选择了一个几何代理，并定义了一个输入图像间的距离度规来优化输入图像到外观的合成。
另外，在训练阶段定义了一个三联损失，对于每张图片，正采样后的图片，负采样后的图片进行训练损失的计算。
在这里插入图片描述

3.语义训练方法

（1）标签化的好处

可以调节单个对象而不是整个被捕获的场景
可以在针对某标签物体进行外边编辑的时候考虑其标签信息

（2）训练方法
使用DeepLab网络，及ADE20K对输入的图像进行训练，得到标签化后的结果。

三、评价

1.阶段性训练对于复杂细节的提升

在这里插入图片描述

2.神经渲染对于点云结果的重渲染

![在这里插入图片描述](https://img-blog.csdnimg.cn/e1815c55aadd49bb81c6ae85115e9bbc.png?x-oss-process

3.语义图像的在不同语境下的平滑过渡

在这里插入图片描述

三、创新点

提出了一套针对户外场景的神经渲染框架，并进行了语义化处理。

四、学术问题

待续

五、个人意义

对于网络的设计仍存在一些疑惑

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。