本周AI热点回顾：王者荣耀AI绝悟完全体开启，英雄随便选；2张图片就能「算出」一段视频；Nature文章明年起可免费下载

飞桨PaddlePaddle

于 2020-11-29 21:15:37 发布

阅读量551

点赞数

文章标签：人工智能算法机器学习深度学习大数据

点击左上方蓝字关注我们

王者荣耀AI绝悟完全体对战开启：英雄随便选，论文已被NeurIPS收录

人工智能 2 级就来越塔来杀我，这游戏怎么玩？

还记得今年五一假期时，腾讯在王者荣耀游戏中上线的绝悟 AI 挑战吗？大多数玩家只能将将挑战前几个难度，AI 击败你之后还会在聊天里嘲讽。在 AlphaGo 的阴影笼罩围棋之后，人工智能也把触角延伸到了最流行的游戏中。

最近，腾讯 AI Lab 在王者荣耀中的研究也获得了学界的认可，研究人员提交的论文也被全球顶尖人工智能会议 NeurIPS 2020 收录。

而在 11 月中旬，升级版的绝悟 AI 挑战也在王者荣耀中上线，20 个难度关卡的设置为玩家们留下了充足的挑战空间。在游戏中，人工智能由 5 个智能体互相协作，并不拥有全局视野，反应速度也被调整为和人类类似。在高级关卡中，AI 也会和你在开战前进行挑选英雄的 BP 博弈。

在 11 月 28-30 日限时开放的绝悟升级版最终挑战里，玩家和 AI 可以选择目前版本游戏里几乎所有的英雄，也接受 5 人组队挑战。看起来自我博弈的 AI 已经达到了无限接近成熟的水平。

根据已经进行的一些比赛来看，绝悟通过自我博弈学习，早已学会了蹲草丛这样的操作：

如果用公孙离这样能秀的英雄，1v3 也是不难的事：

在挑战开启以后，玩家们发现人机对战通常会变成这个样子：选英雄斗智斗勇，准备用上套路——一进游戏刚拉开架势，就被 AI 拿了一血。

据 AI Lab 的研究人员透露：「有些冷门英雄 AI 玩的非常强势，到时候可能会颠覆一部分大家对于游戏的认知。」

在腾讯 AI Lab 及腾讯天美工作室发表的论文《Towards Playing Full MOBA Games with Deep Reinforcement Learning》中，研究人员们提出了 MOBA AI 学习范式，支持使用深度强化学习来玩完整的 MOBA 游戏。

具体而言，该研究将新的和已有的学习技术结合起来，包括课程自我博弈学习、策略蒸馏（policy distillation）, 离策略自适应（off-policy adaption）、多头值估计（multi-head value estimation）、蒙特卡洛树搜索等，在训练和用大量英雄玩游戏，同时巧妙地解决了可扩展性的问题。

多人在线竞技类游戏 MOBA 长久以来一直吸引着众多玩家，其中的王者荣耀、英雄联盟、Dota 2 等最近也常被 AI 研究者当做人工智能的实验场，其中的多智能体、巨大的状态动作空间、复杂的环境等元素向 AI 系统提出了极大的挑战。开发用于 MOBA 游戏的 AI 引起了广泛的关注。

然而，当 OpenAI 的 Dota AI 将游戏限制在只能选择 17 名英雄的情况下，若想扩展英雄库，现有的工作在处理由智能体组合（即阵容）爆炸性增长所导致的游戏复杂性方面的问题存在难度。因此，现有的 AI 系统并不能掌握完全没有限制的 MOBA 游戏。

在日均活跃玩家数量超 1 亿的国民手游王者荣耀上进行测试，展示了人类可以打造出能够击败顶级电子竞技玩家的超级 AI 智能体。通过文献中首次对 MOBA AI 智能体进行大规模性能测试，证明了该 AI 的优越性。

论文地址：

https://arxiv.org/abs/2011.12692

信息来源：机器之心

2张图片就能「算出」一段视频，Reddit网友都惊呆了

只给AI两张图片，就能得到高帧率动态视频？输入的两张图像，重叠后是这样的：

而算出来的视频，是酱婶的：

不错，这又是视频插帧算法的功劳。‍‍‍‍‍‍‍‍‍‍‍‍极限操作玩得6，让老电影变丝滑的常规手法，这个名叫RIFE的AI算法同样信手拈来。右边这支经典探戈，看上去是不是比左边丝滑多了？

不仅是老电影，飞行表演的精彩瞬间，也能一口气从每秒24帧提升到每秒96帧。

动图效果有所损失，不妨再来看一眼原视频。

这项新研究，来自旷视和北大。不仅能让老影像资料追上人民群众对高帧率的需求，支持2X/4X/8X高质量插值，它还有一个最大的特点：快。

看过了RIFE的表现，网友们不由惊叹，这是要超越那只经常在各种修复视频里出现的插帧AI DAIN，引领一波新潮流的节奏啊？一时之间，RIFE在Reddit上的热度飙升到了2.8k。那么，这样的效果究竟是怎么实现的呢？

从双向估计，到一步预测中间帧。视频插帧，通常是用光流预测算法来预测中间帧，并插入两帧之间。光流，就像光的流动一样，是一种通过颜色来表示图像中目标移动方向的方式。

传统光流预测算法，通常根据前后两帧视频来预测中间的某一帧长啥样。将预测完成的图像插进去后，视频看起来就会变得更丝滑。以DAIN的算法为例，如果要预测t时刻的帧，就需要t时刻的前后两帧视频，通过光流预测算法来实现。

但是这一类的算法会产生一个缺点：在预测过程中，如果用前后两帧图像产生双向光流，用线性组合来估计中间流，预测出来的结果，在运动边界区域就会出现伪影。

这样的伪影，使得重建中间帧图像的效果不尽人意。那么，如果换一种思路，直接先预测中间流呢？

相比于利用前一帧和后一帧进行两次估计，这里的IFNET （a Specialized and Efficient Intermediate Flow Network）算法，将直接采用线性运动假设，对中间帧进行一次估计。

效果也显而易见，相比于利用前后两帧的双向估计所产生的光流，利用IFNET估计出的光流效果非常清晰，而且几乎没有伪影。

利用这种方式重建图像，不仅光流边缘看得清楚，而且速度也更快。论文提到，RIFE是首个基于光流的实时视频插帧方案。由于中间帧预测，直接假设了前后两帧的变换是线性的，相当于每帧预测中直接少了一次估计。

信息来源：量子位

飞桨深度学习开源框架2.0抢先看：成熟完备的动态图开发模式

深度学习框架在编程界面上，一般有两种编程模式：命令式编程和声明式编程，即动态图和静态图。动态图模式下程序可即时执行并输出结果，编程体验和调试便捷性更佳；静态图模式下需完成整体网络结构的定义再执行，编程调试便捷性不够，但能够对全局编译优化，更有利于性能的提升，并天然利于模型保存和部署。

飞桨同时支持这两种编程模式，经过长期的深入技术探索和创新，已经实现同时兼顾两种方式的优势，达成了更有利于开发者的“动静统一的理想国”：

模型开发时，采用动态图模式，编程效率高调试方便；
模型训练部署时，支持动态图一键式自动转静态图，实现高性能训练，并无缝衔接模型存储和部署。

图1.飞桨动静统一开发模式

在飞桨开源框架最新版本上，该模式已经达到很高的成熟完备度。开发者既可体验到动态图开发模式带来的极大的便利性，用动态图实现深度学习领域最前沿的模型算法；又可享受到经过极致优化的运行效率，并且可以很容易的将动态图转换为静态图来进行推理和部署。

成熟的动态图模式，可以为开发者带来极致体验，更优雅地编程。总结一下，便利性主要体现在以下三方面：

调试程序的便利性。在动态图开发模式下，用户运行飞桨提供的API后，可即时返回运行结果，不需要先创建计算图再运行，这样便于用户更加方便地组织代码，交互式地调试程序。
组建网络的高效性。在动态图开发模式下，用户可以使用Python的条件判断、循环等控制语句来执行模型算法的运算，不再需要使用静态图中的控制操作来执行运算，这样便于用户更加高效地组建网络。
构建模型的灵活性。在动态图开发模式下，用户可以根据控制流选择不同的分支网络，也可以更自然地构建权重共享的网络，更自然地实现自定义损失函数和循环网络、以及其他新颖的网络结构，从而灵活地进行深度学习模型的创新。

同时，在最新版本上，飞桨动态图提供了对计算机视觉、自然语言处理、推荐系统、语音识别等领域主流算法模型的全面支持，同时也对前沿的学术研究提供了非常好的支持。已开放的动态图模型数量达到了100+。这些模型都已开源在GitHub上，开发者可基于动态图模型进行AI应用开发和前沿学术研究：

https://github.com/PaddlePaddle/models/tree/develop/dygraph

一行代码实现动转静。

动静转换的操作非常简单，仅需添加一个装饰器（ @to_static ），框架就会自动将动态图的程序，转换为静态图的program，并使用该program训练、保存为静态图模型以实现推理部署。

import paddle
from paddle.static import InputSpec
from paddle.fluid.dygraph import Layer
from paddle.jit import to_static


class SimpleNet(Layer):
    def __init__(self):
        super(SimpleNet, self).__init__()
        self.linear = paddle.nn.Linear(10, 3)

    @to_static(input_spec=[InputSpec(shape=[None, 10], name='x'), InputSpec(shape=[3], name='y')])
    def forward(self, x, y):
        out = self.linear(x)
        out = out + y
        return out


net = SimpleNet()
paddle.jit.save(net, './simple_net')

飞桨动转静功能除了简单的一键式操作，还在进一步降低转换出错概率、提供便捷的转换诊断工具方面做了大量工作，为用户提供便捷的体验。

信息来源：飞桨PaddlePaddle

Nature文章明年起可免费下载，不过前提是作者得交7.4万元

好消息！从明年开始在Nature上发表的论文，有些不用付费就可以下载了。

出版商Springer Nature宣布，自2021年起，论文作者在向Nature及其32种旗下期刊投稿时，可以选择以OA （开放获取）形式发表。通过这种形式发表的论文向全社会开放，无论用户所在机构是否支付了订阅费，一律可以免费下载。

不过，前提是论文作者需支付9500欧元（约合人民币7.4万元）的文章处理费。（该费用仅向发表论文收取。）当然，论文作者如果不接受，也可以选择传统方式发表论文，即不支付文章处理费，而让订阅机构或个人付费下载。

对于论文作者来说，开放获取虽然费用更高，但是可以增加文章的阅读量和引用量，有利于扩大自己论文的影响力。据Springer Nature的数据统计，相对于非OA论文，OA论文下载量是其4倍，引用率是其1.6倍，社交媒体引评量是其2.4倍。

目前，Nature及其子刊大部分文章，都需要支付订阅费用才能阅读和下载，并通过订阅方式获取利润，现在等于将部分费用转嫁到作者身上。

此次Natue对每篇OA论文收费9500欧元，遭到了不少科研人员的质疑，因为其他OA期刊的文章处理费最高也就5000美元，Nature的费用比他们高出将近一倍。

一些OA倡导者批评Springer Nature的费用太高。哈佛学术交流办公室主任Peter Suber认为，这是一笔“声誉税”，因为这是期刊高拒绝率付出的代价，但他认为这并不能保证期刊更高的质量。

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

他说：“任何赞助方、大学和作者支付这笔费用都是荒谬的。”加拿大西蒙·弗雷泽大学的传播学者Alperin说，尽管这一声明表明普遍开放获取是不可避免的信号，但对于贫穷国家的研究人员而言，这笔费用实在难以承受。

而伊利诺伊大学香槟分校的图书馆员Lisa Hinchliffe表示，对于作者来说，这笔收费不一定算太高。她认为许多作者会认为这是一个可以接受的价格。Springer Nature发言人回应称，收费比其他出版物都要高，因为Nature品牌的期刊审阅的论文比发表的论文多，并且聘用内部编辑和出版人员，其工作对研究人员具有“巨大价值”。Nature等期刊生产成本中有很大一部分来自评审后被拒绝的论文，如果只能从发表的几篇文章中收取收入，那么每篇文章的费用就会很高。

Springer Nature还引入了一个“指导性OA”（Guided OA）计划，正在《自然·物理学》、《自然-遗传学》和《自然·方法》等6个子刊上进行试验。

信息来源：量子位

用算法改造过的植物肉，有兴趣试试么？

本月初，麦当劳宣布，将于 2021 年推出植物肉全新产品线 McPlant，新品品类将包括汉堡、鸡肉替代品以及早餐三明治。事实上，麦当劳并不是尝试植物基产品的首家快餐店，McPlant 也并非麦当劳在植物肉汉堡上的首次试水。

去年 9 月-2020 年初，麦当劳就曾与美国植物肉生产商 Beyond Meat 合作，在加拿大安大略省部分门店低调发售植物肉汉堡 P.L.T.，测试消费者对人造肉汉堡的接受程度。今年 10 月 12 日，肯德基在国内北上广深杭武汉等 6 个城市的 210 家门店，限时限量试售植物基新品——植物肉汉堡和植物肉鸡块。

植物肉食品顾名思义，是指用植物蛋白替代动物蛋白而制作的食品。相较于肉、蛋、奶等富含动物蛋白的食物，植物肉食品的售价更高。造成这种现象的原因主要有两个：首先是由于植物基食品的开发尚处于早期，成本高，规模效应不明显；其次植物基食品代表了一种更环保、更健康的生活理念，商家希望通过提高售价吸引中高消费人群。

以「人造肉第一股」Beyongd Meat 为例，其研究方法主要是从植物（大豆蛋白、豌豆蛋白）中选择蛋白质和营养元素，然后加入诸如大豆血红蛋白等从植物中提取的着色剂和调味剂，模拟真肉的口感、外观和营养。

据联合国粮食及农业组织公布，可供人类食用的植物种类多达 25 万种，而动植物之间在某些化学构成方面，具有一定的相似度，因此拆解动物蛋白食品，用源自植物的营养元素替代，就成为了可能。

然而动物蛋白食品成分复杂，人类每次只能识别出其中的 2-3 种成分，要想仅依靠人类分解，无疑效率低、效果差。

借助人工智能，可以很好地简化这个问题。成立于 2015 年的智利食品科技公司 NotCo，开发了一种机器学习算法，叫做 Giuseppe。

利用这个算法，可以从一个包含 7000 种植物氨基酸结构的 7 个数据集中，为动物蛋白匹配理想的替代品。

这些分子数据包括食材色泽，以及口感、触感、酸度、浓郁度等科研参数，为植物基食品研发提供了不同维度的参考标准。

根据科研人员输入的食品名称，Giuseppe 会输出 50-60 个配方。研发团队测试所有配方版本后，依据味道、质地、颜色等属性的数值给配方排序，将其交由 Giuseppe 进行迭代，最终找到在口感、外观、营养元素等方面，更接近动物性食物的配方。

点击观看 NotCo 的产品研发故事

截止目前 NotCo 已经成功推出了「以假乱真」的 Not 系列食品，包括牛奶、蛋黄酱、冰激凌、肉饼等，现在他们还在着力开发金枪鱼替代品。

除了工业界，学界也对此表现出了极大的兴趣。2019 年美国圣母大学科研人员发表论文「Amino acids distribution in economical important plants: a review」，探讨了重要经济作物的氨基酸分布情况。

科研人员通过 Google Scholar、 Scopus 和 Google 等渠道，收集了 142 种重要经济作物的氨基酸分布情况，大到国家地域，小到植物部位，分门别类汇总了植物所含有的必需氨基酸、非必须氨基酸、氨基酸种类等详情，对研究动物蛋白的植物替代品具有重要意义。

论文地址：

https://www.sciencedirect.com/science/article/pii/S2452072119300449

信息来源：HyperAI超神经

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础，是中国首个开源开放、技术领先、功能完备的产业级深度学习平台，包括飞桨开源平台和飞桨企业版。飞桨开源平台包含核心框架、基础模型库、端到端开发套件与工具组件，持续开源核心能力，为产业、学术、科研创新提供基础底座。飞桨企业版基于飞桨开源平台，针对企业级需求增强了相应特性，包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业，提供零门槛、预置丰富网络和模型、便捷高效的开发平台；BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。

END