脸书研发新AI工具:让照片中闭眼的人重新睁眼

640?wx_fmt=png

点击上方蓝字 关注网易智能

为你解读AI领域大公司大事件,新观点新应用


640?wx_fmt=jpeg


【网易智能讯 6月18日消息】有很多方法可以处理照片,比如消除红眼或镜头眩光等,让人像看起来更好看。但到目前为止,眨眼已经被证明是拍照最难解决的问题之一。然而,Facebook的研究可能会改变这一切,这个研究正在以一种非常令人信服的方式将闭眼替换为睁开的眼睛。


首先,让我们来回顾下“智能绘画”这项技术,当一个程序用其认为属于该空间的元素填充这个空间时,此技术就会被调用。特别是,Adobe通过其“上下文感知填充(context-aware fill)”充分应用这个技术,允许用户无缝地替换不需要的特征元素,例如突出的分支或云,通过很好地模拟该处应有的元素来进行预测和填充。


但有些功能超出了这类工具的替代能力,其中之一就是眼部位置的替换。眼睛的精细度和高度可变的性质,使系统改变或创建这些位置变得更难。现在,Facebook研究团队决定采取措施来攻克这个问题。


Facebook通过一个生成式对抗网络(GAN)来解决这个难题,GAN本质上是一个机器学习系统,它试图欺骗自己认为其创作是真实的。在GAN中,系统的一部分学会识别面部表情,而系统的另一部分重复创建基于识别部分反馈的图像,逐渐接近现实图像。


640?wx_fmt=jpeg

从左至右:示范图像、源图像、Photoshop睁眼算法、Facebook算法。


在这种情况下,网络接受了训练,以识别和复制令人信服的睁眼图像,但正如你在右边的例子中看到的那样,Photoshop的方法看上去似乎贴在人们的眼睛上,没有考虑与其他图像的一致性。这是因为机器很幼稚,它们没有直觉性理解能力。


Facebook的研究人员所做的就是将示范图像数据包括在内,以显示目标人物睁开眼睛的图像,从中GAN不仅了解到人像的眼睛应该是什么样子,而且还知道目标人物的眼睛该如何塑造,例如如何着色等。


训练的结果是相当真实和令人信服的:没有颜色不匹配或明显的拼接,因为网络的识别部分知道这不是人看起来的样子。


在测试中,人们错误地将虚假的睁眼照片误认为是真实的照片,或者说他们不能确定哪些是真实的,认为这样的被测试者超过了50%。除非观看者知道一张照片被篡改,否则,如果只是在新闻采访中滚动浏览照片,可能也不会特别注意。不过,如果仔细看起来还是有点奇怪。


据Facebook相关研究人员介绍,在某些情况下,此功能仍然会失效,如果一个人的眼睛被头发部分覆盖,或者有时不能正确地重新创建颜色,就会产生奇怪的伪影。目前,研究人员正在解决这个问题。


你可以想象一下,Facebook上的一个自动开眼界工具的用处,它可以检查一个人的其他照片,并用它们作为参考来代替最新的照片。这有点令人毛骨悚然,但这对Facebook来说非常标准,至少它可以挽救一两张合影照片。


选自:techcrunch 

编译:网易智能  参与:nariiy


网易智能

聚焦AI 读懂下一个大时代

长按扫码关注我们

640?wx_fmt=jpeg

加入社群


AI社群(AI专家群、AI黑板报)火热招募中,欢迎对AI感兴趣的小伙伴,添加小助手微信 kaiwu_club,说明身份即可加入。


往期精华


人物专访  沈向洋 | 于尔根 | 洪小文 | 李德毅 | 尤瓦尔 | 哈萨比斯 | 宋继强 | 杨强 | 余凯 | 邓志东 | 芮勇 | 戴文渊 | 石博盟 | 韦东 | 黄学东


行业特稿  抢滩智能音箱(上) | 抢滩智能音箱(下) | 自动驾驶行业素描(上) | 自动驾驶行业素描(下) | 机器翻译技术与应用


重磅报告  麦肯锡(二) | AlphaBeta & ABC | 埃森哲 |  英国政府 | Internet Society | Forrester | VertoAnalytics 麦肯锡(一) | 苹果公司 | 耶鲁大学 


640?wx_fmt=jpeg
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值