50张图片做出李飞飞数万张的效果，类脑AI竟然这样玩？

最新推荐文章于 2020-05-06 16:40:58 发布

量子位

最新推荐文章于 2020-05-06 16:40:58 发布

阅读量587

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yH0VLDe8VG8ep9VGe/article/details/82322462

版权

郭一璞发自凹非寺
量子位报道 | 公众号 QbitAI

640?wx_fmt=jpeg

这张毛色艳丽“星空猫”，在经过图像处理之前长这样：

640?wx_fmt=jpeg

没有了迷幻背景和油画般的毛色，顿时变成了三只“凡猫”。

一个不懂GAN也不会PS的普通人，完成这样的图像处理要几分钟？

在微信通讯录里锁定设计师大神……1分钟；

组织语言求大神帮忙……5分钟；

等大神回复……30分钟；

大神发来了他的报价……卒。

但是对马卡龙玩图的用户来说，只要点几下屏幕就够了。

上传原图，APP自动抠出三只猫；

把背景和猫的渲染风格都设置成星空；

降低猫的亮度，提高猫的对比度。

三步完成只有设计师才能做出的效果，依靠的是马卡龙玩图APP背后的类脑人工智能技术。

一家“沉迷”类脑的AI公司

马卡龙玩图APP之前的名字叫Versa，和背后的这家公司的名字一样。

作为一家专做“P图”的AI创业公司，Versa的研究方向和别家不同：

不做大数据人工智能，专做类脑人工智能。

Versa的CTO赵维杰向量子位介绍了他们的研究方向和特点。

类脑人工智能和基于大数据的人工智能不同，是机器学习的另一个分支，研究类脑计算，以及概念表示、迁移与生成，和脑科学的关系更近一些。

相比依赖大数据进行模型训练的神经网络，类脑人工智能可以实现和人类小孩认识世界类似的能力，仅仅通过少量数据就可以实现一些效果。

比如说，李飞飞2016年的ECCV论文《Perceptual Losses for Real-Time Style Transfer
and Super-Resolution》用到的方法，实现每种风格需要4~8万张图片来进行训练，而Versa的通过类脑人工智能进行风格迁移，每种风格只需要50张图片就可以了。

640?wx_fmt=png

△ Gatys和李飞飞的风格迁移效果图

而概念迁移则是类脑人工智能的另一个优势。拿图片来举栗子，概念迁移是指可以将颜色、形状等基础概念，加上语义，拼接成复杂概念。

作为一家以P图为核心的公司，类脑人工智能便于实现概念迁移的特点也让Versa在“抠图”这个步骤中取得了优势，赵维杰自信满满的说他们的准确率超越了谷歌的Deeplab V3+大约5个百分点，达到了95.7%。

640?wx_fmt=png

△ 抠出人物就可以换背景啦

类脑人工智能的第三个优势“无中生有”被Versa用在了姿态估计上。

通过单目摄像头拍摄出的景象，类脑人工智能“脑补”出景深，可以方便实现3D姿态估计。

类脑狂人赵维杰

说赵维杰是个类脑狂人一点也不为过。

640?wx_fmt=jpeg

目前，赵维杰不仅是Versa的CTO，还是Versa和上海交大的脑科学与人工智能联合实验室主任。

早在2012年，赵维杰就已经开始研究类脑人工智能方向了。

在他看来，依靠大数据的人工智能只能解决一小部分问题，比如图像识别等；而在更广阔的应用场景中，人们无法获得如此大量的数据，只能靠类脑人工智能来解决。

而类脑人工智能本身的概念迁移能力，更让研发的速度足够快。“任意一个基于脑科学的AI公司，都非常容易建立起长期的技术壁垒，”赵维杰说，“假设说现在我们的图像分割算法可能领先行业六个月的话，那我们下一个算法一定领先行业要一年。”

这也让赵维杰找到了自己的创业方向——不是安防、医疗这类基于大数据人工智能的偏B端生意，而是服务更多人、更加多元化的文化产业，通过便捷的图像处理，让不管是设计师还是普通人都可以享受到AI带来的方便和乐趣。

或许，这也是一个AI创业的灵感：谁说底层技术必须服务于B端？

赵维杰告诉量子位，目前Versa在APP端已经拥有1200万用户，未来准备继续在C端通过马卡龙玩图APP服务普通用户，在B端通过Adobe插件的形式，服务专业的设计师，让设计师们不再花大量时间精力用在简单的抠图上。

One More Thing

Versa给量子位展示了马卡龙玩图APP下一个版本即将上线的新功能，名叫inpainting，可以一键P掉照片里的人物。

640?wx_fmt=jpeg

注意“仙人洞”中的那个白衣女子。

640?wx_fmt=jpeg

不见了。

另外，他们还准备把“抠图”功能应用在视频里，比如把这样一段电影：

640?wx_fmt=gif

变成这样：

640?wx_fmt=gif

你觉得效果如何？

最后，读者朋友们对类脑人工智能怎么看？欢迎评论区留言。

— 完 —

加入社群

量子位AI社群19群开始招募啦，欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“交流群”，获取入群方式；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号（QbitAI）对话界面回复关键字“专业群”，获取入群方式。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

640?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
50张图片做出李飞飞数万张的效果，类脑AI竟然这样玩？

郭一璞发自凹非寺量子位报道 | 公众号 QbitAI这张毛色艳丽“星空猫”，在经过图像处理之前长这样：没有了迷幻背景和油画般的毛色，顿时变成了三只“凡猫”...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。