全球首个城市内河无人驾驶数据集发布、奥地利学者用「量子扭曲」加速强化学习 | AI日报...

智源社区

于 2021-03-12 19:20:00 发布

阅读量396

点赞数

文章标签：大数据人工智能机器学习编程语言深度学习

原文链接：https://hub.baai.ac.cn/view/6940

版权

全球首个城市内河无人驾驶数据集发布

近年来，内河无人船因其潜在的应用价值而受到广泛关注，不同于海面无人船和路面自动驾驶场景，内河行驶的无人船的定位和感知面临着独特的挑战。欧卡智舶联合清华大学与西北工业大学的研究学者于近日公开了USVInland数据集，该数据集是第一个内河场景下多传感器的无人船数据集，旨在促进无人船领域相关研究，数据集论文已经被IEEE Robotics and Automation Letters (RA-L) 接收，并将在IEEE International Conference on Robotics and Automation (ICRA) 2021上进行展示。

针对内河无人船实际应用的需求，研究者构建了第一个多传感器、真实场景下内河无人船数据集USVInland。期待通过该数据集的发布，为无人船及水面自动驾驶领域相关研究者提供一个平台和基准，推动解决内河无人船在真实场景应用中面临的挑战。USVlnland主要被设计用于提升无人船在真实内河水域场景下的各项作业能力，USVlnland也是国内首个内河水面无人驾驶数据集，对于国内内河水面无人驾驶技术的发展具有划时代的意义。现在，欧卡智舶已经把USVlnland数据集免费开放给全球各个国家的技术研究者使用，期待USVlnland能够启发更多研究人员进行真实内河水域场景下无人船发展的研究。

数据集下载链接：http://www.orca-tech.cn/datasets

论文全文地址：https://arxiv.org/abs/2103.05383

强化学习得到量子加速，奥地利团队研究登上Nature

强化学习（RL）早已被广泛应用于医疗保健、游戏竞技等实际生活场景中，但它的训练通常需要花费很长的时间。近日，来自奥地利维也纳大学的一组研究人员巧妙地运用量子技巧实现了对处理涉及光子的任务的显著提速。

这项研究于3月10日以「强化学习实验智能体中的量子加速」（Experimental quantum speed-up in reinforcement learning agents）为题发表在《自然》（Nature）杂志上。论文的主要作者是奥地利维也纳大学物理系教授、维也纳量子科学技术中心研究员瓦莱里亚·萨焦（Valeria Saggio）。

目前受量子力学启发的Advantageous RL算法已成功解决了量子信息处理中的问题，但与其他RL算法一样训练耗时良久，与量子计算的速度不匹配。

论文作者Saggio和她的同事们决定在训练中加入量子扭曲，以加快这一进程。他们设计了一个实验，让光子穿过波导并最终进入四种可能状态中的一种，通过给智能体布置任务并设置奖励，确保光子最终处于一种特定的目标状态。实验结果显示，他们的策略将RL的学习时间缩短了63％，从平均270次的猜测缩短到了100次。

超越最新视频压缩标准H.266，字节跳动编码新技术让视频缩小13%

联合视频专家组 JVET 官网显示，字节跳动设立在美国的研发团队于今年初发起了一项视频压缩技术提案，并命名为 DAM（Deep-filtering with Adaptive Model-selection）。相比 H.266/VVC 最新标准，DAM 能够为视频编码性能带来显著提升，亮度信号 Y 可实现 10.28% 的性能增益。两个色度信号 U 和 V 的性能增益也分别达到 28.22% 和 27.97%。这是业界公开的单个智能编码工具的最佳性能增益。

今年初，字节跳动先进视频团队（AVG）向联合视频专家组 JVET 发起了一项 JVET-U0068 技术提案，可以为视频压缩的三个颜色分量（Y, U, V）分别实现约 10%、28%、28% 的性能增益，这是业界公开的单个智能编码工具的最佳性能增益。在优化压缩质量的同时，视频体积相比 H.266 最新标准至少还可以缩小 13%。就其实际效果而言，如果新技术得以应用，与现在主流的 H.264 标准相比，我们看同样质量的视频，大约只需要 22% 的带宽和存储空间。

这项技术名为 DAM（Deep-filtering with Adaptive Model-selection），它是通过深度学习技术构建减少视频压缩失真的滤波器，主干是基于残差单元堆叠的深度卷积神经网络，辅以自适应模型选择以最大程度适应特性复杂的自然视频。该技术由字节跳动 AVG 的美国加州研发团队实现，成员来自高通、英特尔、微软等巨头以及海内外多家顶级院校。

我们先从下图示例中对比 H.264 与 H.266+DAM 的视频压缩效果：

可以看到，相同压缩比条件下，H.266+DAM 编码压缩质量远远优于 H.264。除了视频压缩质量提升之外，应用 DAM 技术可以比H.266再缩小 13% 的数据体积，以下图片来自国际标准组织的测试视频。其中，图（左）为原图，每像素 12 字节；图（中）使用 VTM11.0 压缩（qp=42），每像素 0.00216字节，峰值信噪比 27.78dB；图（右）使用 VTM11.0+DAM（qp=42），每像素 0.00184 字节，峰值信噪比 28.02dB。

NLP明星公司Hugging Face（抱抱脸）获4000万美元投资

NLP界颇有知名度的Hugging Face（抱抱脸）公司刚刚完成4000万美元B轮融资。投资者除Betaworks等著名孵化机构外，NBA球星里的投资鬼才凯文·杜兰特也在其中。Hugging Face在2016年以娱乐型聊天机器人起家，当时只有5人。后转型成专注NLP的技术公司，在GitHub上发布了开源NLP库Transformers，2年多来已获4.2万星。2020年，Hugging Face开始做面向企业的定制NLP模型，包括其客户包括彭博社和高通等100多家公司，并且今年以来一直处于正现金流状态。Hugging Face总融资额已达到6000万美元，据称，上一轮1500万美元中的90%至今还躺在银行里。如此厉害的公司，到现在也只有30名员工。

目前，Hugging Face开源社区中，已有超过6000个模型和近800个数据集，涵盖300多种语言。