三维重建以及神经渲染中的学习（三）

出门吃三碗饭

已于 2024-01-04 00:12:23 修改

阅读量221

点赞数

分类专栏：三维重建 Nerf学习记录文章标签：学习论文阅读三维重建三维图形可控

于 2023-07-12 16:53:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40514113/article/details/131685731

版权

Nerf学习记录同时被 2 个专栏收录

16 篇文章 21 订阅

订阅专栏

12 篇文章 3 订阅

订阅专栏

三维重建以及神经渲染中的学习

公众号AI知识物语

本文内容为参加过去一次暑期课程学习时的笔记，浅浅记录下。

三维图形可控生成：

1：学习一个图形生成模型
2：具有可控三维变量：1物体形状；2物体位置；3物体颜色；4物体位姿

3：三五监督难获取，仅以无相机位子的二维观察为监督
4：无分割、深度、物体位姿等额外监督
在这里插入图片描述

Towards Unsupervised Learning of Generative Models for 3D Controllable Image Synthesis

CVPR 2020

在这里插入图片描述

第一步：3D generator中，只生成前景/背景的primitives，每个primitive表示为o_i =（R_i, t_i , s_i, Φ_i）理解为--------旋转、平移、skill、以及 appearance feature

第二步：对于每个primitive，采用一个相机位置，并把他渲染到二维的图像上，然后单独渲染每个primitive，得到特征图X，Alpha图A以及深度图D

第三步：采用2D Generator 把特征图转变为 RGB图以及图像本书的mask和它的深度，基于深度顺序，采用Alpha composition 组合多个前景以及背景。

第四步：Loss_adv 用来判别完整/背景图形； L_com约束紧致性，L_geo 约束多视角一致性

结果：

在这里插入图片描述

目前的不足

在这里插入图片描述

多个物体有时候会被单个primitive表征
视角变化大的时候多视角一致性可能不再满足

如何改善三维表征提高一致性

在这里插入图片描述

1:采用Volume Rendering生成图片，避免2D Generator引起的视角不一致
2:采用神经隐式表征，内存占用不随分辨率增长

GRAF: Generative Radiance Fields

在这里插入图片描述

Radiance field 把三维坐标以及视角向量转换为颜色以及密度

通过在射线上采样N个点，通过体渲染公式获得对应像素颜色
在这里插入图片描述

区别是：

（1）GRAF 引入2个隐变量z作为radiance field 的输入

（2）z_s为形状隐变量 z_a为颜色隐变量

（3）针对R条稀疏采样的射线，生成器重复这一步骤

（4）相机内参、外惨以及生成R条射线的栅格V均为随机采样得到

（5）生成大小32×32的图片块，常数内存占用以及渲染时间

（6）随机采样过程控制了该图片块的位置以及覆盖大小

出门吃三碗饭

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
三维重建以及神经渲染中的学习（三）

三维重建以及神经渲染中的学习三维图形可控生成：本文内容为参加过去一次暑期课程学习时的笔记，浅浅记录下。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。