AI无人机竞速击败人类冠军，Nature封面：将AlphaGo成果带到物理世界

人工智能学家

于 2023-09-01 14:30:42 发布

阅读量107

点赞数

文章标签：人工智能无人机

原文链接：https://mp.weixin.qq.com/s?__biz=MzIwOTA1MDAyNA==&mid=2649981928&idx=3&sn=77d224d697463b2bb84d6454022d48b4&chksm=8f7ee32fb8096a39179e8438d020165a2adb76eb24814d99c311a63b073d02a5b6ccb4635be6&scene=126&sessionid=0

版权

来源：量子位

AI再一次击败人类世界冠军，登上Nature封面。

与上一次AlphaGo下围棋不同，这次不是脑力运动，而是在真实物理环境中的竞技体育项目——“空中F1”无人机竞速。

与AlphaGo也有相同之处，核心技术都是深度强化学习。

成果来自苏黎世大学，作者之一Davide Scaramuzza认为，这是国际象棋的深蓝、围棋的AlphaGo之后的又一大突破。

这标志着自主移动机器人首次在为人类设计并由人类设计的物理环境体育运动中击败人类冠军。

微软高级研究工程师Shital Shah认为这比AlphaGo更难，也更难获得认可，但仍是历史性的里程碑。

# 深度强化学习，又一次胜利

先介绍一下这个运动项目：FPV（第一人称视角）无人机竞速。

人类选手会通过机载摄像头传输的视频，从无人机的视角观察环境，穿越障碍。

赛道由七个方形大门组成，每一圈都必须按顺序通过。要赢得比赛，参赛者必须连续领先对手完成三圈。

两台无人机同时出发，正面对决，最高速度可达每小时100公里，同时承受数倍于重力的加速度。

这次与AI同台的是2019年无人机竞速联盟世界冠军Alex Vanover、MultiGP国际公开赛世界杯冠军Thomas Bitmatta和三届瑞士全国冠军Marvin Schaepper。

对AI来说，要达到专业人类选手的水平非常有挑战性，因为无人机需要在物理极限下飞行，同时仅通过机载传感器估计速度和位置。

为解决这些挑战，苏黎世大学设计了Swift，由两个关键模块组成：

感知系统，将高维视觉信息和惯性信息转换为低维表示。
控制策略，感知系统产生的低维表示并产生控制命令。

其中，感知系统主要是一个VIO（Visual-Inertial Odometry）模块，同时利用视觉和惯性传感器对自身定位和对环境建模。

VIO估计与神经网络相结合，用于检测障碍门的四个角点。

控制策略是一个前馈神经网络，使用无模型的On-policy深度强化学习进行模拟训练，奖励目标结合了向下一个门的中心前进，和保持下一个门在摄像机视野内。

为了弥合模拟和物理世界之间感知和动力学上的差距，使用了从物理系统中收集的数据，驱动一个MLP残差模型。

在比赛开始前，人类选手在指定赛道上有一周的练习时间，赛道包含“Split-S”等高难度机动动作。

具体规则还有：由声学信号(发令枪）开启比赛，如果发生碰撞也可以继续比赛，如果两架无人机都坠落则飞得远的获胜。

最终在与三位人类选手的比赛中，Swift分别拿下了9局5胜，7局4胜，和9局6胜的成绩。

在Swift输掉的比赛中，有40%是因为与对手发生碰撞，40%是因为与门发生碰撞，20%是因为速度比人类慢。

Swift还在比赛中取得最快记录，人类选手的最佳时间领先半秒。

在累计300圈的数据中，Swift平均时间更短，方差更低，代表AI每圈都稳定追求更快圈速。

而人类则会在自己领先时保持一个较慢的速度，降低碰撞的风险，表现出更大的方差。

这也体现出当前的Swift系统无法得知对手的情况，在领先时不够稳，落后时又不够浪。

# AI与人类选手，哪里不同？

在论文中，团队还讨论了AI与人类选手的更多对比。

首先，Swift利用了机载惯性传感器，这类似于人类的前庭系统。

但反而是人类在这个项目上无法使用前庭系统，因为他们不随无人机一起移动，感受不到加速度。

另外，Swift的传感器延迟更低为40毫秒，专业人类选手平均能做到220毫秒。

但Swift的摄像头刷新率有限，只有30Hz，人类使用的摄像头则120Hz。

最后，人类有更高的韧性。

比如即使在全速坠机了只要设备没坏就能继续比赛，但Swift没有接受碰撞后恢复的训练。

如果改变比赛现场的光照环境，Swift的感知系统就会失效。

作者认为，这项研究可能会激发在其他物理系统（例如自动驾驶汽车、飞机和机器人）中跨广泛应用部署基于混合学习的解决方案。

论文地址：
https://www.nature.com/articles/s41586-023-06419-4
参考链接：
[1]https://x.com/davsca1/status/1696938013421429111

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）大脑研究计划，构建互联网（城市）大脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

如果您对实验室的研究感兴趣，欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

人工智能学家

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
AI无人机竞速击败人类冠军，Nature封面：将AlphaGo成果带到物理世界

来源：量子位AI再一次击败人类世界冠军，登上Nature封面。与上一次AlphaGo下围棋不同，这次不是脑力运动，而是在真实物理环境中的竞技体育项目——“空中F1”无人机竞速。与AlphaGo也有相同之处，核心技术都是深度强化学习。成果来自苏黎世大学，作者之一Davide Scaramuzza认为，这是国际象棋的深蓝、围棋的AlphaGo之后的又一大突破。这标志着自主移动机器人首次在为人类设计并由...
复制链接

扫一扫

人工智能学家 CSDN认证博客专家 CSDN认证企业博客

码龄7年

183: 原创

-: 周排名

216万+: 总排名

716万+: 访问

: 等级

6万+: 积分

4495: 粉丝

2537: 获赞

353: 评论

1万+: 收藏

私信

关注

热门文章

最新评论

这是关于物理学的最强科普
World_Scientology: 有实力，不过您似乎忘了最前沿的：凝聚态、高能、天体物理？
人工智能的现状与未来（附PPT）
程小程: 在哪里能下载啊？？？
【精彩文章】数学家论数学——数学的本质
iw1210: ！！数学的本质！！数学体系先天就有缺陷！！！许多痴迷的数学家们都患有脱离实际幻想症！这帮家伙智慧低下、智力单一，没有逻辑思维，没有大局观，整天坐在井里看天，自我陶醉，胡乱假设，胡乱猜想，胡乱定义……搞出来的东西毫无逻辑、自相矛盾、破绽百出、悖论重重！这帮低智慧单智力家伙，整天呆在家里自作聪明意淫出各种花样题目，犹如穿开裆裤的孩子玩过家家、捉迷藏、走迷宫游戏，毫无意义，毫无价值，浪费时间！！有人说手机电脑等科技产品大部分功劳是数学，我来告诉你真相：人类社会的所有文明和科技，数学的功劳不到0.01%，99.99%的功劳是逻辑学及其他。逻辑学是单独的学科，不属于数学，数学是它码的没有逻辑最不讲逻辑的傻逼学科！！数学的功能最它码简单，就是量化，如果把人类社会的所有发展成果比作高楼大厦，数学就是一个工量具卷尺，它码的不切实际盲目夸大数学功劳，就如同说“建设高楼大厦主要功劳是卷尺”，岂不荒唐可笑！！在哲学面前，数学连个屁都不是！！！
ChatGPT被爆重大漏洞！3.5用户可以免费白嫖4.0 Plus！
云外星沉月落: 已经不行了
OpenAI Sam Altman对AI的最新思考：5.9 投资人峰会访谈（全文+视频）
JJJ69: 写得不错，对我有帮助

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。