本周AI热点回顾：Facebook竞赛50万美元冠军成绩被莫名取消、哈工大、哈工程被禁用「工科神器」MATLAB

百度大脑

于 2020-06-14 20:24:23 发布

阅读量718

点赞数

文章标签：人工智能深度学习编程语言机器学习大数据

50万美元冠军成绩被莫名取消，Facebook热门数据竞赛引争议

本届 Deepfake 比赛，主办方 Facebook 开出了共计百万美元的奖金，其中头名团队可以获得 50 万美元。在这项赛事中，数据科学家们需要通过算法检测出使用 Deepfake 技术换脸的「虚假图像」，帮助阻止恶意篡改的图片误导他人。丰厚的奖金，热门的研究领域让 DFDC 在去年 9 月宣布以来受到了业内的广泛关注。这项比赛在去年 12 月的 NeurIPS 2019 大会上公布了数据集并正式开始，今年 3 月 31 日结果提交正式截止。据统计，这一在著名数据竞赛平台 Kaggle 上进行的比赛吸引了 2114 名参与者，并获得了 3.5 万种检测算法，最终得出的最高准确率达 82.56％，整体平均准确度为 65.18%。

在这场比赛中，原本排名第一的团队因为数据的原因，优势方案被取消成绩，最终他们的第二方案获得了第七名。该团队的成员表示，在过去两个月中，这一团队与 Facebook 进行了多轮接触，但没有获得令两方信服的结果。

没有触犯任何规则却被取消了成绩，还要求参赛队伍提交额外数据集里出现人物每个人肖像的授权许可，facebook 这样「魔性」的要求让参赛队伍在过去两个月的交涉过程中身心俱疲。这一事件爆出后立即引发了社区的大量讨论，Facebook 对于头名团队的奇怪要求成为了主要槽点：

英伟达资深系统软件工程师，Kaggle Grandmaster 获得者 Bojan Tunguz 对此表示：「几乎所有计算机视觉研究都依赖于预先训练的模型，这些模型显然已经在有人类照片的数据集上进行了训练。如果我们需要所有这些人的明确同意才能进行研究，那么就不会有什么开放科学。」

根据 Kaggle 条款，除非法律禁止，否则你与任何竞赛实体因为数据竞赛产生的纠纷，任何奖项的确定都不得诉诸于任何形式的集体诉讼。因此这一争议目前看来无法通过法律途径来解决了。

信息来源：机器之心

哈工大、哈工程被禁用「工科神器」MATLAB，美国「实体名单」影响深入校园

哈工大、哈工程的老师和学生们最近无法使用 MATLAB 了，这一消息迅速成为了人们关注的热点。近日，在知乎等社交网络上，有哈工大学生表示收到了正版软件取消激活的通知，而在与 MATLAB 开发公司 MathWorks 交涉之后，人们得知因为美国政府实体名单的原因，相关授权已被中止。

哈工大学生使用正版 MATLAB 近几天遭遇的情况：6 月 6 号人们在使用 MATLAB 时突然跳出反激活通知，此时点击反激活还能使用。但到了 6 月 7 号启动 MATLAB 时又显示授权许可无效，网页无法登录哈工大域名的账户，重置密码后邮件显示：

这是一件令人无语的事。该学生表示，作为已付费的正版软件，未来也许还有希望有限使用。但 MATLAB 被封禁也可能只是一个开始，更多来自美国的软件可能都会碰到这种情况。

哈工大、哈工程最近的遭遇，和去年华为被美国列入「实体名单」时有些相似。由于美国的制裁措施，自去年 5 月至今华为手机一直不能使用谷歌服务框架等一系列软件服务。如果观察美国商务部 5 月 22 日公布的「实体名单」，会发现目前已包含 13 所中国大学：北京航空航天大学、中国人民大学、国防科技大学、湖南大学、哈尔滨工业大学、哈尔滨工程大学、西北工业大学、西安交通大学、电子科技大学、四川大学、同济大学、广东工业大学以及南昌大学。

纵观这些高校，其优势学科覆盖范围很广，实力也非常强大，涉及航空航天技术、材料、仪器、计算机、工程、人工智能等多个领域。如果阻止这些高校与美国的学术交流，甚至正常教学活动，是对中国高科技发展的一种限制。

对于现在的工科生来说，MATLAB 是必不可少的工具，其必要性可能仅次于 Office 了。如果 MATLAB 官方对哈工大、哈工程持续施行禁用，那么凡是这些学校发表的论文，其中就不能出现利用 MATLAB 得到的数据、图、表等——无论你使用的是正版还是盗版。

在社交网络上，有 Mathworks 员工表示：这次哈工大被禁是因为美国商务部出台的实体名单，Mathworks 作为有军工应用产品的美国公司只能遵守法规，这并不是 MathWorks 的主动行为。所谓被禁也只是不能提供技术支持和未来的商务合作，之前卖出去的正版授权应该还是可以用的。

该员工还表示 MathWorks 的立场一直是非常反对贸易战的，公司高层在季度大会上明确表示过对华为的禁运会损害人类的科技发展与合作。但是毕竟作为美国公司，Mathworks 也只能被迫执行禁令。

信息来源：机器之心

飞桨核心框架最新升级：灵活高效兼顾，动静自然统一

在近期举办的“WAVE SUMMIT 2020”深度学习开发者峰会上，百度飞桨总架构师于佃海提到：“飞桨的迭代前进，离不开两个重要驱动轮：一个是产业实践的打磨，一个是用户体验的持续优化。两个驱动轮互相配合，给飞桨提供了持久、广泛的发展动力，驱动飞桨拥有一个最灵活易用的产业级深度学习框架。”

这两个驱动，对应到框架的设计，就是在确保高效的同时，做到灵活易用。基于这一指导思想，飞桨在编程界面上同时支持了命令式编程和声明式编程，即通常说的动态图和静态图。

如何兼顾这两种模式的优势，做到灵活编程、高效训练和部署，同时具备更统一的编程体验，是一个很大的挑战。最新发布的飞桨核心框架1.8版本，带来了重磅更新，总结下来包括两点：

1、动态图性能更卓越，经过多个版本的持续深度优化，飞桨动态图的训练性能已经媲美静态图。

2、动静更加统一，完备实现了一键式动转静、动静混合编程，使动态图开发可以无缝衔接部署，并能通过静态图执行模式对部分模型实现进一步的训练加速。

飞桨框架的设计思想，是期望将深度学习计算的编程和内在表示保持一致，所以从用户界面上没有引入Graph等概念，直接以程序化的“Program”形式描述神经网络模型的计算过程，对应的用户开发和通用的编程体验更加接近。

其实对飞桨而言，基于编程一致的计算描述，向动态图的扩展，以及动静转换都是非常自然的。

其实，对于大部分任务而言，无需通过动静转换，飞桨的动态图训练已经具备非常高的性能。飞桨自1.3版本版增加动态图功能以来，持续数个版本，一直致力于提升训练的整体性能。目前在主流的任务上，飞桨动态图执行模式已经能够达到与静态图媲美的水平。

以上数据对比了几个主流模型在单张NVIDIA V100 GPU配置上的训练数据，测试环境如下：

Ernie：基于Wikipedia数据集，配置batch_size 50, seqlen256；
Resnet50：基于imagenet数据集，配置 batch_size 128；
Transformer base：基于iwslt14 de-en数据集，配置max_token = 4096；
Mobilenetv2：基于imagenet数据集，配置batch_size 256。

可以看出同模型在动态图模式下的训练速度与静态图相当。

信息来源：飞桨PaddlePaddle

从无声的画面读出声音 AI 学会了「读唇术」

近日，一个印度的技术团队发布了在 AI“读唇术”领域的最新成果。研究人员从数据驱动学习的维度去探讨一个问题：“如何从一个人的唇部动作来准确地推断 ta 的个人语言风格和内容？”

要想由唇部动作生成语音，必须一些无法忽视的阻碍，比如很多听觉上完全不同的声音，在唇部动作上是十分相似甚至完全一样的。

对于专业的唇读者来说，他们会借助其他方式来增加还原唇语的准确性，比如根据所谈论话题去联想、根据面部表情和手势等因素去推测。还有一点就是，对于聋哑人和专业的唇读者来说，读取那些经常互动的人的唇语会更容易。

研究者收集了一个120小时的视频数据集，其中5位讲话者在不受约束的环境中进行自然陈述，并设立一种基于唇部动作生成语音的序列 Lip2Wav 对视频进行分析，与之前的同类模型相比，Lip2Wav 在不受约束环境中生成语音的清晰度提高了接近 4 倍，在人工评估方面也显示，该模型生成语音的韵律更加丰富自然。

信息来源：百度AI

本周论文推荐