无需大量算力训练,通过“读”解说员的评论,AI也能学会国际象棋

大数据文摘出品
编译:啤酒泡泡


20世纪90年代后期,IBM深蓝(Deep Blue)研究了一系列的国际象棋算法,期望于打败当时的世界冠军加里•卡斯帕罗夫(Garry Kasparov)。

2016年底,Deepmind在《自然》(Nature)发布论文,报告了他们的最终版围棋程序AlphaGo Zero,这是一个能够完全自学围棋具有革命性意义的算法。不论何种游戏,只要告诉系统这个游戏的基本规则,它就能通过不断的自我对弈学习最终掌握游戏的核心。


而最近,伦敦大学学院的研究人员发现,不需要练习,机器可以通过“阅读”解说员的评论区分好棋和臭棋,学会如何下国际象棋,以及如何更高效地做其他事。


国际象棋爱好者的最爱莫过于讨论Bobby Fischer高超的弃子战术,或是当今世界冠军Magnus Carlsen一连串天才般的进攻招式。事实证明,这种闲谈可以帮助人工智能软件学习如何下国际象棋。不久的将来,这项技术可以教会机器利用我们语言中的情感内容来掌握各种实用技能。

国际象棋算法,SentiMATE,是由伦敦大学学院的研究人员Nicholas McCarthy,Isaac Kamlish和Issac Bentata Chocron设计的。它通过分析专业解说人员的反应来评价每步棋的质量,进而学会这项新的技能。

他们的团队分析了网上2700局国际象棋的评论。他们剔除了那些与好棋无关的解说评论,以及那些表意不明确的评论。然后,他们使用了一种很特殊的循环神经网络和词向量(一种能联系词含义的数学方法)方法,并采用了最先进的模型来分析语言。

 
人工智能最近在语言解析上取得了很显著的进展。例如,位于旧金山的OpenAI研究公司开发出了一种算法,它可以根据一些提示的词汇生成整篇新闻故事。

“自然语言处理领域的未来发展方向,应该是将这种已经学到的信息转换成实实在在的可以解决实际问题的行为”,研究人员在邮件中告诉麻省理工学院技术综述杂志,“我们觉得文字数据的学习方法是一个非常值得探索的研究道路”。
 
SentiMATE的出现让研究人员大吃一惊,因为它可以解决一些国际象棋的基本原则和一些关键策略,例如捉双(一个棋子可以同时攻击敌方两个或更多棋子)和王车易位(国王和车在棋盘下方移动到更偏防守的位置)。
 
它不是人工智能大师,它做不到一直战胜某些传统的国际象棋游戏机器人。但是这个程序表明,未来可以使用语言来学习如何玩好游戏。与传统方法相比,它只需更少的数据,而且不需要很强的计算能力。


国际象棋一直是检验机器智能进展的标志性事物,从艾伦图灵1951年的国际象棋程序(写入论文)到加里卡斯帕罗夫败在IBM的“深蓝”手中。
 
包括deepmind的网红程序“AlphaZero”,游戏的规则会输入到该程序中,然后它通过跟不同版本的自己对战来提高技战术。因为是自学,AlphaZero发展出一些少见而又令人惊讶的策略。

但是和“深蓝”一样,AlphaZero需要几千个谷歌的张量处理器以及上百万盘棋局的数据。
 
研究人员说,SentiMATE使用的学习方法不仅仅可以用到国际象棋中,还可以应用到很多其他的实际问题中。例如,这些方法或许可以帮助机器分析运动、预测金融活动、以及提供更好的推荐。“有很多书籍、博客和论文在等着它去学习”,团队人员指出。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
城市应急指挥系统是智慧城市建设的重要组成部分,旨在提高城市对突发事件的预防和处置能力。系统背景源于自然灾害和事故灾难频发,如汶川地震和日本大地震等,这些事件造成了巨大的人员伤亡和财产损失。随着城市化进程的加快,应急信息化建设面临信息资源分散、管理标准不统一等问题,需要通过统筹管理和技术创新来解决。 系统的设计思路是通过先进的技术手段,如物联网、射频识别、卫星定位等,构建一个具有大信息感知和通信能力的网络和平台。这将促进不同部门和层次之间的信息共享、交流和整合,提高城市资源的利用效率,满足城市对各种信息的获取和使用需求。在“十二五”期间,应急信息化工作将依托这些技术,实现动态监控、风险管理、预警以及统一指挥调度。 应急指挥系统的建设目标是实现快速有效的应对各种突发事件,保障人民生命财产安全,减少社会危害和经济损失。系统将包括预测预警、模拟演练、辅助决策、态势分析等功能,以及应急值守、预案管理、GIS应用等基本应用。此外,还包括支撑平台的建设,如接警中心、视频会议、统一通信等基础设施。 系统的实施将涉及到应急网络建设、应急指挥、视频监控、卫星通信等多个方面。通过高度集成的系统,建立统一的信息接收和处理平台,实现多渠道接入和融合指挥调度。此外,还包括应急指挥中心基础平台建设、固定和移动应急指挥通信系统建设,以及应急队伍建设,确保能够迅速响应并有效处置各类突发事件。 项目的意义在于,它不仅是提升灾害监测预报水平和预警能力的重要科技支撑,也是实现预防和减轻重大灾害和事故损失的关键。通过实施城市应急指挥系统,可以加社会管理和公共服务,构建和谐社会,为打造平安城市提供坚实的基础。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值