计算机视觉与图形学-神经渲染专题-神经体渲染:NeRF与Beyond-I

(说明:如果您认为下面的文章对您有帮助,请您花费一秒时间点击一下最底部的广告以此来激励本人创作,谢谢!!!)

f2e08d022744fb33374efc2ce0ae2c88.png

1、简介

神经渲染的定义:“深度图像或视频生成方法可以显式或隐式控制场景属性,例如照明、相机参数、姿势、几何、外观和语义结构。” 它是一种新颖的、数据驱动的解决方案,用于解决计算机图形学中长期存在的虚拟世界真实渲染问题。

神经体渲染是指通过将光线追踪到场景中并在光线长度上进行某种积分来生成图像或视频的方法。通常,像多层感知器这样的神经网络会将光线上的 3D 坐标中的函数编码为体密度和颜色等值,这些值被集成以产生图像。

2、神经隐表面

神经体渲染的前身是使用神经网络定义隐式表面表示的方法。许多 3D 感知图像生成方法使用体素、网格、点云或其他表示,通常基于卷积架构。

2.1 占用和符号距离函数

以下是CVPR 2019 的三篇论文和ICCV 2019 的一篇(PIFu):

占用网络(Mescheder et al., 2019) 引入了隐式的、基于坐标的占用学习。由 5 个 ResNet 块组成的网络采用特征向量和3D 点并预测二进制占用。

IM‑NET (Chen 和 Zhang,2019 年)使用6 层MLP 解码器,在给定特征向量和3D 坐标的情况下预测二进制占用。可用于自动编码、形状生成(GAN 风格)和单视图重建。

DeepSDF (Park et al., 2019) 直接从3D 坐标和可选的隐编码来回归有符号距离函数,它使用 8 层 MPL与第 4 层的跳跃连接。

PIFu (Saito et al., 2019)表明,可以通过将 3D 点重新投影到像素对齐的特征表示中来学习隐式模型。这个想法稍后将在 PixelNeRF 中重新出现。

2.2 创建隐函数

Structured Implicit Functions (Genova et al., 2019) 证明可以将这些隐式表示结合在一起,例如,简单地将它们相加

CvxNet (Deng et al., 2020b) 通过采用逐点最大值(在 3D 中)来组合有符号距离函数。该论文还有其他几种技术来从深度或 RGB 图像中重建对象。

BSP‑Net (Chen et al., 2020) 在许多方面与CvxNet 相似,但在其核心使用二进制空间划分,从而输出多边形网格的方法,而不是昂贵的网格划分方法。

Deep Local Shapes (Chabra et al., 2020) 在体素网格中存储一个DeepSDF隐编码来表征更大和扩展场景。

Scene Representation Networks (Sitzmann et al., 2019) 或 SRN 在架构方面与 DeepSDF 非常相似,但添加了可微的光线行进算法来找到学习隐式曲面的最近交点,并添加MLP 来回归颜色,使其能够从多个姿势图像中学习。

可微分体积渲染(Niemeyer 等人,2019 年)表明,隐式场景表示可以与可微分渲染器相结合,使其可从图像中训练,类似于 SRN。他们使用术语体积渲染器,但真正的主要贡献是提出一个技巧,使隐式表面的深度计算可微,而不使用体上的积分。

Implicit Differentiable Renderer (Yariv et al., 2020) 提出了类似的技术,但具有更复杂的表面光场表示,并且还表明它可以在训练期间改进相机姿态。

神经关节形状近似(Deng et al., 2020c) 或NASA 组成隐式功能来表示关节物体,如人体。

更多内容请关注公众号:元宇宙MetaAI

欢迎朋友们投稿,投稿可添加微信:NewYear-2016

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
nerf-simple是基于PyTorch框架实现的NERF神经辐射场)模型的简单版本。NERF是一种用于生成高质量逼真图像的深度习模型,它通过对场景中各个点的辐射值进行建模,从而实现精确的三维重建和渲染。 在NERF模型中,神经辐射场是核心概念之一。它是一个由多个隐藏层组成的神经网络,用于估计场景中每个点的辐射值。这里的辐射值通常表示像素的RGB颜色值或光强度。 nerf-simple通过使用PyTorch框架的张量操作和自动微分功能来实现NERF模型。首先,我们需要定义一个神经网络模型,包括隐藏层的数量和大小。这个模型可以基于现有的PyTorch模块,如nn.Linear和nn.ReLU,以便构建非线性变换和特征提取。 然后,我们需要定义训练过程,实现数据加载、优化器设置和损失函数计算等步骤。训练数据通常包括一系列场景中的图像及其对应的相机和深度信息。 在模型训练完成后,我们可以使用训练好的神经网络来生成逼真的图像。通过对场景中每个像素点的辐射值进行预测,我们可以还原出场景的三维形状和纹理信息,并最终渲染出高质量的图像。 总结来说,nerf-simple是一个使用PyTorch实现的简单版本NERF模型,它通过神经辐射场来估计场景中每个像素点的辐射值,从而实现精确的三维重建和渲染。通过定义神经网络模型、训练过程和图像生成过程,我们可以利用这个模型生成逼真的图像。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值