3D卷积GAN飞起！微软“可缩放”新框架只需2D数据即可生成逼真3D模型

最新推荐文章于 2024-04-29 18:15:17 发布

机器学习与AI生成创作

最新推荐文章于 2024-04-29 18:15:17 发布

阅读量624

点赞数

分类专栏：扩散模型与GAN生成对抗网络

扩散模型与GAN生成对抗网络专栏收录该内容

121 篇文章 127 订阅

订阅专栏

点击上方“机器学习与生成对抗网络”，关注"星标"

获取有趣、好玩的前沿干货！

本文转载自新智元

新智元报道

来源：VB

编辑：元子

【新智元导读】Microsoft Research近日发表论文介绍了一种通过2D数据生成3D模型的新框架，其使用3D卷积GAN，利用2D图像提供的物体表面之间的曝光差异成功检测出凹形物体的内部结构，从而准确捕捉物体的空间结构，在识别物体形状方面优于当前模型。

将2D图像转换成3D图像是一件非常困难的事情，包括Facebook，Nvidia的AI研究实验室，以及Threedy.ai之类的初创公司都在不断的在此领域进行探索。

微软开发首个针对2D数据的3D模型的“可缩放”训练技术

最在一份新的预印本论文中，来自Microsoft Research的团队详细介绍了一个框架。研究人员称，该框架是首个针对2D数据的3D模型的“可缩放”训练技术。

据悉，仅使用2D图像进行训练，该框架可以始终学习比现有模型更好的形状，这对于缺乏从头开始创建3D形状的视频游戏开发人员，电子商务企业和动画工作室可能是一个福音。

与以前的工作相反，研究人员试图利用功能齐全的工业渲染器，例如显示数据生成图像的软件。为此，他们训练了3D形状的生成模型，以便生成与2D数据集的分布相匹配的图像。

生成器模型采用随机输入向量（代表数据集特征的值）并生成3D对象的连续体素表示（3D空间中网格上的值）。然后，它将体素馈送到不可微分的渲染过程，该过程将阈值设置为离散值，然后再使用现成的渲染器（在OpenGL之上构建的Pyrender）进行渲染。

一种新颖的代理神经渲染器（proxy neural renderer）直接渲染由3D生成模型生成的连续体素网格。正如研究人员所解释的那样，在给定3D网格输入的情况下，它经过训练可以匹配现成渲染器的渲染输出。

采用3D卷积GAN架构，可以生成逼真的样本

在实验中，该团队为生成器采用了3D卷积GAN架构。从3D模型生成的一系列合成数据集和一个现实生活的数据集，他们合成了来自不同对象类别的图像，并在整个训练过程中从不同的角度对其进行了渲染。

研究人员说，他们的方法利用了图像提供的照明和阴影提示，使其能够从每个训练样本中提取更多有意义的信息，并在这些设置下产生更好的结果。

此外，在对自然图像的数据集进行训练后，它可以生成逼真的样本。该论文的合著者写道：“我们利用表面之间的曝光差异成功地检测出凹形物体的内部结构，从而使其能够准确地捕获凹面和中空空间。”

参考链接：

https://venturebeat.com/2020/03/05/microsofts-ai-generates-3d-objects-from-2d-images/

公众号近期荐读：

GAN整整6年了！是时候要来捋捋了！

新手指南综述 | GAN模型太多，不知道选哪儿个？

数百篇GAN论文已下载好！搭配一份生成对抗网络最新综述！

见微知细之超分辨率GAN！附70多篇论文下载！

有点夸张、有点扭曲！速览这些GAN如何夸张漫画化人脸！

天降斯雨，于我却无！GAN用于去雨如何？

脸部转正！GAN能否让侧颜杀手、小猪佩奇真容无处遁形？

容颜渐失！GAN来预测？

强数据所难！SSL（半监督学习）结合GAN如何？

弱水三千，只取你标！AL（主动学习）结合GAN如何？

异常检测，GAN如何gan ?

虚拟换衣！速览这几篇最新论文咋做的！

脸部妆容迁移！速览几篇用GAN来做的论文

【1】GAN在医学图像上的生成，今如何？

01-GAN公式简明原理之铁甲小宝篇

GAN&CV交流群，无论小白还是大佬，诚挚邀您加入！

一起讨论交流！长按备注【进群】加入：

更多分享、长按关注本公众号：

机器学习与AI生成创作

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。