三维重建以及神经渲染中的学习(三)

三维重建以及神经渲染中的学习

公众号AI知识物语

本文内容为参加过去一次暑期课程学习时的笔记,浅浅记录下。

三维图形可控生成:

1:学习一个图形生成模型
2:具有可控三维变量:1物体形状;2物体位置;3物体颜色;4物体位姿

3:三五监督难获取,仅以无相机位子的二维观察为监督
4:无分割、深度、物体位姿等额外监督
在这里插入图片描述

Towards Unsupervised Learning of Generative Models for 3D Controllable Image Synthesis

CVPR 2020

在这里插入图片描述
在这里插入图片描述

第一步:3D generator中,只生成前景/背景的primitives,每个primitive表示为o_i =(R_i, t_i , s_i, Φ_i) 理解为--------旋转、平移、skill、以及 appearance feature

第二步:对于每个primitive,采用一个相机位置,并把他渲染到二维的图像上,然后单独渲染每个primitive,得到特征图X,Alpha图A以及深度图D

第三步:采用2D Generator 把特征图转变为 RGB图以及图像本书的mask和它的深度,基于深度顺序,采用Alpha composition 组合多个前景以及背景。

第四步:Loss_adv 用来判别 完整/背景图形 ; L_com约束紧致性,L_geo 约束多视角一致性

结果:

在这里插入图片描述
在这里插入图片描述

目前的不足

在这里插入图片描述

多个物体有时候会被单个primitive表征
视角变化大的时候多视角一致性可能不再满足

如何改善三维表征提高一致性

在这里插入图片描述

1:采用Volume Rendering生成图片,避免2D Generator引起的视角不一致
2:采用神经隐式表征,内存占用不随分辨率增长

GRAF: Generative Radiance Fields

在这里插入图片描述

Radiance field 把三维坐标以及视角向量转换为 颜色以及密度

通过在射线上采样N个点,通过体渲染公式获得对应像素颜色
在这里插入图片描述

区别是:

(1)GRAF 引入2个隐变量z作为radiance field 的输入

(2)z_s为形状隐变量 z_a为颜色隐变量

(3)针对R条稀疏采样的射线,生成器重复这一步骤

(4)相机内参、外惨以及生成R条射线的栅格V均为随机采样得到

(5)生成大小32×32的图片块,常数内存占用以及渲染时间

(6)随机采样过程控制了该图片块的位置以及覆盖大小

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值