CommAI,Facebook的AI训练和测试系统

Facebook最近发布了CommAI-env,一个用于训练和评价AI系统的平台。这个平台是受一个机器智能的路线图启发,旨在教授智能代理一般的学习能力,作为进一步、更专业的、通过人类或机器级的互动培训的基础。

\\

CommAI的工作原理是通过工作平台分配任务给学习者,如果学习者能给出正确的答案,就会再给予奖励。这种类型的互动能训练系统去通过奖励,识别正确或不正确的答案。任务千变万化,从最简单的沉默-不沉默,到越来越复杂的、需要学习者长期记忆的任务,所有都在同一次训练环节里完成。

\\

OpenAI GymMazeBase等相似的系统相比,这是一个但不是唯一的区别因素。通过消除在训练测试集之间的流行的界限,系统旨在概括学习者学习新的、未知的问题的能力,以及快速解决简单的、过去见过的问题的能力。

\\

学习者算法的接口定义了两个函数。

\\

next(self, input_bit)作为算法的输入,接收工作平台的一段输入,并且由学习者返回下一段内容。

\\

reward(self, reward)将为学习者提供从工作平台中获得的奖励。

\\

追逐奖励的迭代工作将在学习过去数据和适应新难题的过程中训练算法。

\\

培训平台为开发者提供绑定,可以使用任何编程语言定义学习者通过ZeroMQ消息队列进行学习。该项目仍然处在Beta测试阶段,它有一个Facebook群对其进行讨论和提供支持。该平台代码是用Python写的,代码在GitHub上托管。

\\

查看英文原文CommAI, a Training and Testing AI System by Facebook

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值