ICLR 2023 | 神经规范场:渲染引导空间规范变换

97568644753b7abeb966b64b86c124a6.gif

©作者 | 占方能

单位 | 马克斯普朗克计算机所

研究方向 | 神经渲染

近期,神经场(Neural Fields)领域的巨大进展,已经显著推动了神经场景表示和神经渲染的发展。为了提高 3D 场景的计算效率和渲染质量,一个常见的范式是将 3D 坐标系统映射到另一种测量系统,例如 2D 流形和哈希表,以建模神经场。本文将这种坐标或者测量系统的转换定义为“规范变换”(gauge transformation)。

这种规范变换通常采用预定义的函数,例如 EG3D 中的垂直投影和 Instant-NGP 中的空间哈希函数。然而,这种预先定义的函数往往并非最优选择,所以一个很自然的问题浮现出来:是否能以端到端的方式直接学习规范变换,让它与神经场一同进行优化?本研究将此问题拓展为一个广义的范式,包括连续型和离散型规范变换,并设计了统一的学习框架以共同优化规范变换和神经场。

f2d3345bbaf8bf80e4b4777e51b28723.png

论文地址:

https://arxiv.org/abs/2305.03462

GitHub地址:

https://github.com/fnzhan/Neural-Gauge-Fields

项目地址:

https://fnzhan.com/Neural-Gauge-Fields/

8bc4978a6f21b6f9314af47de49060d8.png

介绍

规范通常表示一种测量标准或测量系统,比如温度测量中的华氏度和摄氏度。而两种规范之间的转换则被称为规范变换,比如华氏度和摄氏度之间的转换。在物理领域中,各种坐标系统的变换也可以被称之为规范变换,如图一所示的局部和总体的规范变换。

1d6c1ed0f91e4fe8c407eb61a366b363.png

▲ 图一:物理中的规范变换

而在神经场领域中,规范变换的定义可以进一步扩展为连续变换和离散变换,如图二。

06081ae6d8b3abc78eaa65fb13538f88.png

▲ 图二:神经场的规范变换

连续规范变换:如果目标规范(测量系统)是连续的,那么这种变换定义为连续规范变换。这种连续规范变换,基本等同于坐标变换。对于一个原始 3D 空间中的点x,可以通过一个神经网络 M 对它进行规范变换,从而得到它在目标规范中的新坐标即 M(x) 或者 x+M(x)。这个新坐标可以用来索引神经场,包括隐式神经场(MLP-based)和显式神经场(grid-based)。连续规范变换的典型应用包括 UV 纹理映射和学习 TriPlane 映射。

对于 UV 纹理映射,规范变换具体定义为 3D 空间到 2D UV 空间的映射,由于神经场是在 2D UV 空间进行索引,所以我们通过在 UV 空间进行均匀点采样可以得到每个点的颜色,从而得到显式的 UV,同时可以对 2D UV 进行编辑(如图)。

56d22b1e95b271b3803e3ea44150d7f0.gif

▲ 图三:学习 2D UV 映射和进行 UV 编辑

对于 TriPlane 映射也是类似,我们采用三个单独的网络来分别学习 3D 空间到 2D 平面的映射。我们发现这种可学习的变换可以提升 TriPlane 神经场的渲染效果和模型收敛速度,如图四所示。

db37d4efcc3bfcc03bf98165b7a9cb93.png

▲ 图四:学习 3D 空间到 TriPlane 的规范变换

以上只是列举出两种应用,实际上这种可学习的连续规范变换可以根据目的灵活地嵌入到各种 NeRF 模型当中,比如动态场景 NeRF,和基于 NeRF 的本征分解。

离散规范变换:如果目标规范是离散的(比如哈希表空间),那么这种变换定义为离散规范变换。由于离散空间的索引参数是离散的,我们不能像连续规范变换那样直接通过网络预测索引参数值。所以,对于 3D 空间中的一个点x,我们用神经网络预测这个点在哈希表上的离散概率分布,然后通过 Top-1 操作得到最大概率点对应的哈希表索引。由于 Top-1 操作是不可微分的,所以需要通过重参数技巧来得到近似梯度进行模型优化,算法流程图五所示。

e5e4b77ee6d4aa8cd4d82be1524f4fd1.png

▲ 图五:离散规范变换学习中的正向/反向传播

离散规范的主要应用包括 Instant-NGP 的模型压缩,可泛化 NeRF 等。对于可泛化 NeRF,由于哈希映射变得可学习,所以多个场景都可以学习映射到同一个哈希表中,从而实现场景泛化 NeRF。

85ebe56b7d2e517f7ed2e9ce8930db64.png

可视化分析

尽管证明了学习规范变换是可行的,但是学习到的规范变换具体遵循什么样的规律依然不清楚,所以这里对学习到的规范变换进行了可视化。对于 3D 空间和 2D 流形(球面或者平面)的规范变换,我们学习一个逆映射将 2D 流形上均匀采样的点投影到 3D 空间,如图六所示。

c7bb2af0cf1fc186d0d5a86cdf1c68c6.gif

▲ 图六:规范变换可视化

通过观察,我们发现学习到的规范变换和场景的几何(或者说密度)有很明显的关系,物体表面的点(也就是密度比较大的点)会被很好的投影到目标平面即占有率很高,而密度小的点所在空间会被高度压缩并在目标平面只有很低的占有率。这个结果也符合直觉:物体表面对渲染结果影响最大,所以渲染损失函数倾向于让物体表面更多地占用目标平面的特征,同时压缩对渲染影响很小的低密度空间。

e07301a72e16f1fc2fcc200fe1720776.png

信息不变性规范

理想情况下,我们期望 3D 空间信息能在规范变换中保证保持不变(Information Invariant, or InfoInv),一半情况下这个很难实现,这里我们通过推导证明了神经场中的位置编码实际上实现了规范变换中的相对信息不变性,从而有助于神经场建模。而本质上,这种不变性规范是对神经场坐标施加了一个相位变换 :

335fa8682c27145a09856674dc8f22c8.png

a6e8260d47fa85a542f16adc22b2f5dc.png

如图七所示,将位置编码简单地和 Grid 或者 MLP-based 神经场结合都能显著提高模型效果。近期的 PET-NeuS 等工作也证明了这种方法的有效性。

94688d0b04c1d6256fafe48c25905b86.png

▲ 图七:信息不变性规范与 Grid 和 MLP-based 神经场结合

cdfd368ae0bd89fbc713ca737dd35872.png

总结

这篇文章主要介绍了神经场中的规范变换,尤其是如何通过渲染损失联合优化神经场景表示和规范变换。通过应用和实验,证明了这种可学习规范变换的优点和广泛适用性,包括 UV 映射,TriPlane 神经场等。基于这种可学习的规范变换,还有大量神经渲染任务值得深入探索和应用。

更多阅读

32516ff148ae989d46be21d46815f56d.png

b9f03c25aee2324c2abe85b6235356a5.png

053ef510afb871e7a0544ffa5634cec5.png

00a2b100af7fc7f0127211a5cc976499.gif

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

90c23d1247fad5bd9a9d90cca04537de.png

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

·

d914a4b2c54d079fb317d0f42c3a5db2.jpeg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于Springboot+Vue的智慧养老服务管理系统源码+项目使用说明(优秀毕业设计).zip 该项目属于个人毕业设计,经导师的精心指导与严格评审获得高分通过的设计项目。主要针对计算机相关专业的教师、正在做毕设、课设的学生使用,也可作为项目实战演练,可直接作为课程设计、期末大作业、毕设等。 1.项目代码功能经验证ok,确保稳定可靠运行。欢迎下载使用!在使用过程中,如有问题或建议,请及时私信沟通。 2.主要针对各个计算机相关专业,包括计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网等领域的在校学生、专业教师或企业员工使用。 3.项目具有丰富的拓展空间,不仅可作为入门进阶,也可直接作为毕设、课程设计、大作业、初期项目立项演示等用途。 4.当然也鼓励大家基于此进行二次开发。 5.期待你能在项目中找到乐趣和灵感,也欢迎你的分享和反馈! 介绍 随着人口老龄化趋势的加剧,老年人口比例不断增加,传统的养老服务模式已经难以满足现代老年人的多元化需求。因此,如何高效、精准地提供养老服务,成为了社会关注的焦点。信息化与智能化的发展为养老服务带来了新的机遇。智慧养老作为新兴的养老服务模式,正逐步改变传统的养老服务格局。 #### 安装教程 1. 运行环境准备mysql8+java8+npm14.16.1 2. 配置maven路径,加载依赖 3. 运行sql文件,确保application.yml的数据库名称和账号密码是数据库所在主机的账号密码 #### 使用说明 1. 登入 账号:admin 密码:admin 账号:user 密码:123456 2.运行流程 前端初始化指令: > npm install 前端运行指令(有两个端,一个是管理端,一个是用户端): > npm run serve #### 项目演示 + 普通用户 访问者可以在最顶端看到系统的导航栏,根据自己的需求点击需要去到的页面。用户可以单击“入院指南”,在入院指南界面的输入框中输入标题并进行搜索,就可以查看标题、发布时间、注意事项、发布人、封面等其他信息,在个人中心界面中,可以看见家属的账号、密码和性别等基本信息,还可以对这些信息进行更新操作。 ![GIF 2024-6-17 19-49-40](GIF 2024-6-17 19-49-40-1718630421956.gif) + 管理员 管理员单击家属管理,在家属管理页面中输入家属的各项信息后,在页面中进行查询、新增或删除家属信息等操作。管理员点击护工管理,在护工管理页面中输入护工的所有信息,然后在页面上可以点击详情来查看护工的详细情况,点击修改来修改护工的信息,点击删除来删除护工的信息。管理员单击房间资料管理,在这个页面中可以对房间资料的信息进行管理。管理员单击床位管理,可以查看房间号、楼房名称等各项信息,还可以点击修改来修改床位信息,点击删除来删除床位信息。管理员还可以对老人入住进行管理,在这个界面中可以查看像入住编号、老人年龄等老人入住的详细信息,可以在界面顶端输入具体信息来查找,还可以点击删除来进行删除操作。管理员单击外出报备管理,在外出报备管理界面中可以查看老人的外出报备情况。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值