3D卷积GAN飞起!微软“可缩放”新框架只需2D数据即可生成逼真3D模型

点击上方“机器学习与生成对抗网络”,关注"星标"

获取有趣、好玩的前沿干货!

本文转载自新智元


  新智元报道  

来源:VB

编辑:元子

【新智元导读】Microsoft Research近日发表论文介绍了一种通过2D数据生成3D模型的新框架,其使用3D卷积GAN,利用2D图像提供的物体表面之间的曝光差异成功检测出凹形物体的内部结构,从而准确捕捉物体的空间结构,在识别物体形状方面优于当前模型。

将2D图像转换成3D图像是一件非常困难的事情,包括Facebook,Nvidia的AI研究实验室,以及Threedy.ai之类的初创公司都在不断的在此领域进行探索。

微软开发首个针对2D数据的3D模型的“可缩放”训练技术

最在一份新的预印本论文中,来自Microsoft Research的团队详细介绍了一个框架。研究人员称,该框架是首个针对2D数据的3D模型的“可缩放”训练技术。

据悉,仅使用2D图像进行训练,该框架可以始终学习比现有模型更好的形状,这对于缺乏从头开始创建3D形状的视频游戏开发人员,电子商务企业和动画工作室可能是一个福音。

与以前的工作相反,研究人员试图利用功能齐全的工业渲染器,例如显示数据生成图像的软件。为此,他们训练了3D形状的生成模型,以便生成与2D数据集的分布相匹配的图像。

生成器模型采用随机输入向量(代表数据集特征的值)并生成3D对象的连续体素表示(3D空间中网格上的值)。然后,它将体素馈送到不可微分的渲染过程,该过程将阈值设置为离散值,然后再使用现成的渲染器(在OpenGL之上构建的Pyrender)进行渲染。

一种新颖的代理神经渲染器(proxy neural renderer)直接渲染由3D生成模型生成的连续体素网格。正如研究人员所解释的那样,在给定3D网格输入的情况下,它经过训练可以匹配现成渲染器的渲染输出。

采用3D卷积GAN架构,可以生成逼真的样本

在实验中,该团队为生成器采用了3D卷积GAN架构。从3D模型生成的一系列合成数据集和一个现实生活的数据集,他们合成了来自不同对象类别的图像,并在整个训练过程中从不同的角度对其进行了渲染。

研究人员说,他们的方法利用了图像提供的照明和阴影提示,使其能够从每个训练样本中提取更多有意义的信息,并在这些设置下产生更好的结果。 

此外,在对自然图像的数据集进行训练后,它可以生成逼真的样本。该论文的合著者写道:“我们利用表面之间的曝光差异成功地检测出凹形物体的内部结构,从而使其能够准确地捕获凹面和中空空间。”

参考链接:

https://venturebeat.com/2020/03/05/microsofts-ai-generates-3d-objects-from-2d-images/


公众号近期荐读:

GAN整整6年了!是时候要来捋捋了! 

新手指南综述 | GAN模型太多,不知道选哪儿个?

数百篇GAN论文已下载好!搭配一份生成对抗网络最新综述!

见微知细之超分辨率GAN!附70多篇论文下载!

有点夸张、有点扭曲!速览这些GAN如何夸张漫画化人脸!

天降斯雨,于我却无!GAN用于去雨如何?

脸部转正!GAN能否让侧颜杀手、小猪佩奇真容无处遁形?

容颜渐失!GAN来预测?

强数据所难!SSL(半监督学习)结合GAN如何?

弱水三千,只取你标!AL(主动学习)结合GAN如何?

异常检测,GAN如何gan ?

虚拟换衣!速览这几篇最新论文咋做的!

脸部妆容迁移!速览几篇用GAN来做的论文

【1】GAN在医学图像上的生成,今如何?

01-GAN公式简明原理之铁甲小宝篇


GAN&CV交流群,无论小白还是大佬,诚挚邀您加入!

一起讨论交流!长按备注【进群】加入:

更多分享、长按关注本公众号:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值