[CVPR2021]pixelNeRF: Neural Radiance Fields from One or Few Images

标题:pixelNeRF: Neural Radiance Fields from One or Few Images

链接:https://arxiv.org/pdf/2012.02190

本文是针对NeRF的优化,NeRF中往往需要同一个场景中非常多的图片才能很好地生成新的视角,而pixelNeRF就提出了一种方式来让模型在仅有几张甚至一张图的情况下也能生成新视角。

文中提出,NeRF之所以无法在一张图基础上生成新视角的原因是没有先验信息。因此本文预先通过resnet对输入图片提取了基于每个像素的信息,然后在生成新视角时通过查询对应像素上的信息从而获得先验,辅助NeRF生成新视角的图像。

上图就是在网络仅有一张图片作为输入时网络的运行流程,最中间绿色的那个f其实就是NeRF,因此与NeRF唯一的区别其实就是CNN Encoder。

网络运行流程如下:

1.首先给定一张图片,然后使用预训练好的CNN Encoder(ResNet34)提取出图像中每个像素的特征,构建出W,即特征图。

2.然后给出一个想要生成的新视角的相机内参d,按照NeRF中描述的方式往空间中发射一道光线,将交点x投射到输入图所对应的平面上,并从特征图中提取对应的特征。

3.然后将提取出的特征和x,d一起输入NeRF,从而得到最终的颜色和密度信息。

4.最后通过体渲染来的到最终结果,与Ground truth做损失函数来优化整个网络。

上面说的是输入一张图时的做法,但其实这个模型也可以处理输入多张图的情况,具体做法就是从每张图中都提取一个特征图,然后将交点x投射到每个平面上,进而从每个特征图中都提取一个特征。最后将每个特征都分别送入NeRF,对结果做聚合再得到最终的颜色核密度。

具体的流程就是上面所说的那样,但有些点需要详细说一下:

1.在提取特征的时候为了获取局部和全局的信息,作者同时提取了resnet中四个池化层的特征,因此每个像素中都包含了局部和全局的信息

2.特征输入NeRF的方式是通过类似residual的方式来引入的,并不是直接和x,d合并

一些想法

个人认为这个提feature的思想其实和NLP中对单词做embedding没有区别,只不过NLP中针对的是每个词语,而这里针对的是每个像素。通过大量相似场景的训练来让模型获得一些先验(类似于人的直觉),进而获得想象图片中蕴含的3D信息的能力,从而从feature中预测出不同视角中的信息。

设想一下,如果没有这个预先提取的特征图,直接按照文中描述的方式训练能得到什么样的结果?如果不提取特征图那输入nerf的额外信息就只有对应像素上的一个RGB值,nerf无法知道这个像素周围都有什么东西,因此像素之间无法建立起关联。因此,所谓的先验肯定都是从feature中获得的。

但是,文中的feature是使用预训练的resnet提取的,这提取的feature真的适用于这个任务吗?如果使用一个网络来专门学习特征提取会不会更好?

推荐观看:【论文阅读】PixelNeRF 具有泛化性的NeRF CVPR2021_哔哩哔哩_bilibili

  • 3
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
在Matlab中,CNN-TL是指基于卷积神经网络(CNN)和传输线模型(TL)的一种图像识别方法。 这种方法的目标是通过使用CNN网络从图像中提取特征,并将这些特征输入到TL模型中进行进一步的处理,以实现图像识别和分类的任务。 具体来说,CNN-TL方法的流程包括以下步骤: 1. 数据预处理:对输入的图像进行预处理,包括图像的大小调整、归一化等操作,以便于后续的特征提取和训练过程。 2. 数据标记:对训练集和测试集的图像进行标记,即给每个图像分配一个对应的类别标签,以便在训练和测试过程中进行监督学习。 3. 网络模型:构建CNN网络模型,包括卷积层、池化层和全连接层等,用于从输入图像中提取特征。 4. 训练集和测试集的训练:使用训练集的图像和对应的标签,通过反向传播算法对CNN网络进行训练,优化网络的权重和偏置参数。 5. 图像识别:使用训练好的CNN网络模型对测试集的图像进行识别和分类,输出每个图像所属的类别标签。 通过这个CNN-TL方法,我们可以实现对图像进行准确的分类和识别,从而在图像分析和处理的任务中得到更好的结果。引用提供了一个在Matlab中实现CNN-TL方法的代码库,可以通过GitHub链接进行查看和使用。引用则提供了一个关于IHC-ANF模型的相关笔记本,可以用来复制和验证相关的数字结果。<span class="em">1</span><span class="em">2</span>

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值