人类对手还能赢吗?谷歌AI在乒乓球场上的惊人表现!

AI 乒乓球机器人的突破

你是否想挑战一个机器人打乒乓球?谷歌DeepMind公司宣布,他们训练了一个机器人,使其达到了业余级别的竞技表现。该公司声称,这是第一次有机器人被教会与人类一起在人类水平上进行运动。
研究人员设法让一个机械臂握着3D打印的球拍,在与不同水平的人类对手进行的
29场完整竞技乒乓球比赛
中,赢得了13场。这项研究发表在Arxiv的一篇论文中。
这个系统还远非完美。尽管乒乓球机器人能够击败它所面对的所有初学者级别的人类对手,以及55%的业余水平选手,但它在与高级选手的所有比赛中都输了。尽管如此,这仍然是一个令人印象深刻的进步。
“即使在几个月前,我们还预计机器人可能无法赢得它以前没有玩过的人的比赛。系统的表现确实超出了我们的预期,”领导该项目的谷歌DeepMind高级软件工程师Pannag Sanketi说。“机器人甚至在对抗强大对手时的策略运用令人惊叹。”
这项研究不仅仅是好玩。事实上,它代表了向创建能够在真实环境中熟练和安全地执行有用任务的机器人迈出了一步,这些环境包括家庭和仓库,这是机器人学界的长期目标。谷歌DeepMind训练机器的方法适用于该领域的许多其他领域,纽约大学的计算机科学研究人员Lerrel Pinto说,他没有参与这个项目。
“我非常欣赏看到机器人系统真正与真人一起工作,这是这方面的一个极好的例子,”他说。“它可能不是强手,但有持续改进并最终达到目标的原始材料。”

技术实现与挑战

要成为一个熟练的乒乓球选手,人类需要出色的手眼协调能力、快速移动能力和迅速做出反应决策的能力——所有这些都是对机器人的重大挑战。谷歌DeepMind的研究人员采用了两步方法来训练系统模仿这些能力:他们使用计算机模拟来训练系统掌握击球技能;然后使用真实世界数据进行微调,这允许它随着时间的推移而改进。
研究人员编制了一个乒乓球状态的数据集,包括位置、旋转和速度的数据。系统从一个设计用来准确反映乒乓球比赛物理学的模拟环境中提取这个库,学习如回发球、正手前旋或反手击球等技能。由于机器人的限制意味着它不能发球,所以现实世界的比赛被修改以适应这一点。
在与人类的比赛中,机器人收集其表现数据以帮助完善其技能。它使用一对摄像机捕捉的数据来跟踪球的位置,并通过在其对手的球拍上使用LED的运动捕捉系统来跟踪其人类对手的打球风格。球的数据反馈到模拟中进行训练,创建了一个持续的反馈循环。
这种反馈允许机器人测试新技能以尝试击败对手——这意味着它可以像人类一样调整其战术和行为。这意味着它不仅在给定比赛中逐渐变得更好,而且随着它玩的比赛越多,随着时间的推移也会变得更好。
当球被打得非常快、超出它的视野范围(超过桌子上方六英尺),或者非常低时,系统很难击球,因为有一个协议指示它避免可能损坏其球拍的碰撞。旋转球证明是一个挑战,因为它缺乏直接测量旋转的能力——高级选手很快就利用了这个限制。

未来展望与人类体验

在模拟环境中为所有可能的情况训练机器人是一个真正的挑战,Mytra机器人公司的创始人,之前是特斯拉机器人团队负责人的Chris Walti说,他没有参与这个项目。
“实际上模拟真实世界是非常非常困难的,因为有很多变量,比如一阵风,甚至是桌子上的灰尘,”他说。“除非你有非常现实的模拟,否则机器人的表现将会受到限制。”
谷歌DeepMind相信这些限制可以通过多种方式解决,包括开发旨在预测球的轨迹的预测性AI模型,并引入更好的碰撞检测算法。
至关重要的是,人类玩家享受了与机械臂的比赛。即使是能够击败它的高级选手也表示他们发现这种体验很有趣,很有吸引力,并表示他们认为它有潜力成为一个动态的练习伙伴,帮助他们磨练技能。
“我绝对希望它成为我的训练伙伴,时不时地进行一些比赛,”一位研究参与者说。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值