50张图片做出李飞飞数万张的效果,类脑AI竟然这样玩?

郭一璞 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

640?wx_fmt=jpeg

这张毛色艳丽“星空猫”,在经过图像处理之前长这样:

640?wx_fmt=jpeg

没有了迷幻背景和油画般的毛色,顿时变成了三只“凡猫”。

一个不懂GAN也不会PS的普通人,完成这样的图像处理要几分钟?

在微信通讯录里锁定设计师大神……1分钟;

组织语言求大神帮忙……5分钟;

等大神回复……30分钟;

大神发来了他的报价……卒。

但是对马卡龙玩图的用户来说,只要点几下屏幕就够了。

上传原图,APP自动抠出三只猫;

把背景和猫的渲染风格都设置成星空;

降低猫的亮度,提高猫的对比度。

三步完成只有设计师才能做出的效果,依靠的是马卡龙玩图APP背后的类脑人工智能技术。

一家“沉迷”类脑的AI公司

马卡龙玩图APP之前的名字叫Versa,和背后的这家公司的名字一样。

作为一家专做“P图”的AI创业公司,Versa的研究方向和别家不同:

不做大数据人工智能,专做类脑人工智能。

Versa的CTO赵维杰向量子位介绍了他们的研究方向和特点。

类脑人工智能和基于大数据的人工智能不同,是机器学习的另一个分支,研究类脑计算,以及概念表示、迁移与生成,和脑科学的关系更近一些。

相比依赖大数据进行模型训练的神经网络,类脑人工智能可以实现和人类小孩认识世界类似的能力,仅仅通过少量数据就可以实现一些效果。

比如说,李飞飞2016年的ECCV论文《Perceptual Losses for Real-Time Style Transfer
and Super-Resolution》用到的方法,实现每种风格需要4~8万张图片来进行训练,而Versa的通过类脑人工智能进行风格迁移,每种风格只需要50张图片就可以了。

640?wx_fmt=png

 Gatys和李飞飞的风格迁移效果图

概念迁移则是类脑人工智能的另一个优势。拿图片来举栗子,概念迁移是指可以将颜色、形状等基础概念,加上语义,拼接成复杂概念。

作为一家以P图为核心的公司,类脑人工智能便于实现概念迁移的特点也让Versa在“抠图”这个步骤中取得了优势,赵维杰自信满满的说他们的准确率超越了谷歌的Deeplab V3+大约5个百分点,达到了95.7%。

640?wx_fmt=png

 抠出人物就可以换背景啦

类脑人工智能的第三个优势“无中生有”被Versa用在了姿态估计上。

通过单目摄像头拍摄出的景象,类脑人工智能“脑补”出景深,可以方便实现3D姿态估计。

类脑狂人赵维杰

说赵维杰是个类脑狂人一点也不为过。

640?wx_fmt=jpeg

目前,赵维杰不仅是Versa的CTO,还是Versa和上海交大的脑科学与人工智能联合实验室主任。

早在2012年,赵维杰就已经开始研究类脑人工智能方向了。

在他看来,依靠大数据的人工智能只能解决一小部分问题,比如图像识别等;而在更广阔的应用场景中,人们无法获得如此大量的数据,只能靠类脑人工智能来解决。

而类脑人工智能本身的概念迁移能力,更让研发的速度足够快。“任意一个基于脑科学的AI公司,都非常容易建立起长期的技术壁垒,”赵维杰说,“假设说现在我们的图像分割算法可能领先行业六个月的话,那我们下一个算法一定领先行业要一年。”

这也让赵维杰找到了自己的创业方向——不是安防、医疗这类基于大数据人工智能的偏B端生意,而是服务更多人、更加多元化的文化产业,通过便捷的图像处理,让不管是设计师还是普通人都可以享受到AI带来的方便和乐趣。

或许,这也是一个AI创业的灵感:谁说底层技术必须服务于B端?

赵维杰告诉量子位,目前Versa在APP端已经拥有1200万用户,未来准备继续在C端通过马卡龙玩图APP服务普通用户,在B端通过Adobe插件的形式,服务专业的设计师,让设计师们不再花大量时间精力用在简单的抠图上。

One More Thing

Versa给量子位展示了马卡龙玩图APP下一个版本即将上线的新功能,名叫inpainting,可以一键P掉照片里的人物。

640?wx_fmt=jpeg

注意“仙人洞”中的那个白衣女子。

640?wx_fmt=jpeg

不见了。

另外,他们还准备把“抠图”功能应用在视频里,比如把这样一段电影:

640?wx_fmt=gif

变成这样:

640?wx_fmt=gif

你觉得效果如何?

最后,读者朋友们对类脑人工智能怎么看?欢迎评论区留言。

加入社群

量子位AI社群19群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

640?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
加拿大滑铁卢大学的神经学家和软件工程师表示,这是迄今为止产生的世界上最复杂、最大规模的人类大脑模型模拟。这个名叫Spaun的大脑由250万 个模拟神经元组成,它能执行8种不同类型的任务。这些任务的范围从描摹到计算,再到问题回答和流体推理(fluid reasoning),可谓五花八门。测试期间,科学家亮出一系列数字和字母,让Spaun记入储存器,然后科学家亮出另一种字母或符号,作为指令,告诉 Spaun借助它的记忆力做什么。随后机械臂会描绘出任务输出。该研究成果发表在《科学》杂志上。Spaun的大脑由250万个神经元组成,它分解成一串模拟头盖骨子系统,其中包括前额皮质、基底神经节和丘脑,它们通过模拟神经元连接在一起,精 确模拟真正的人类大脑的线路布局。这种模拟大脑的基本概念,是努力让这些子系统的行为很像真正的大脑:视觉输入经过丘脑处理,最终数据被储存在神经元里, 然后基底神经节向一部分皮层发送任务指令。所有这些计算结果都是通过精确的生理学模拟进行的,模仿电压尖脉冲和神经传递素。Spaun甚至模拟了人类大脑 的局限性,努力储存更多短期记忆,而不是少量记忆。从机械学上来说这个模拟大脑非常简单,但是它的变通能力非常惊人。研究人员表示,在这种大脑的发展方面存在一些非常诱人的暗示:从简单任务开始,然后把它们积聚起来,组合到一起,制成具有复杂功能性的模型。由克里 斯-埃利亚史密斯领导的这个科研组称,他们下一步是让Spaun具备自适应可塑性——通过简单的行动重新布局新线路、学习新任务的能力,而不只是按照事先 编排好的程序做。作为终极目标,埃利亚史密斯非常看好Spaun的发展前景。他说:“它有助于我们了解大脑行为、生物基及其相关行为。这对所有类型的健康 应用非常重要。”测试中他“杀死”人造神经元,并观察Spaun的执行能力的下降,这对了解自然衰老和退行性疾病至关重要。Spaun是根据Nengo制成的,后者是用来模拟神经系统的一种图形化的开源软件包。如果你想模拟自己的大脑,你可以下载Spaun神经模型,不过你可能需要比台式电脑更强的执行能力 标签:Nengo

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值