#今日论文推荐# DeepMind 新作:AI 系统实现以人为中心的分配机制设计

#今日论文推荐# DeepMind 新作:AI 系统实现以人为中心的分配机制设计

如何在经济和社会系统中重新分配资源?例如,一群人决定集中资金进行投资,获得回报后该如何分配收益?简单的平均分配看起来不太公平,但按照每个人的初始投资规模按比例分配,就真的公平吗?近日,DeepMind公司开发了名为 Democratic AI 的系统来探索解决这个机制设计问题。Democratic AI 可以直接学习最大化一群人的偏好,融合人类思想家和专家之前为解决再分配问题而提出的各种想法,从而设计出更受欢迎的分配策略。该方法解决了 AI 研究中的一个关键挑战——如何训练符合人类价值观的人工智能系统。

构建与人类价值观一致的人工智能(AI)是一个尚未解决的问题。近日DeepMind公司发表于Nature Human Behavior 的最新研究开发了一个名为“民主AI”(Democratic AI)的方法,利用强化学习设计一种大多数人喜欢的社会机制。
一群人在玩一个在线投资游戏,其中涉及决定是保留一笔货币捐赠,还是与其他人分享,以实现集体利益。共享收益通过两种不同的再分配机制返还给玩家,一种是由AI设计的,另一种是由人类设计的。AI发现了一种机制,可以纠正最初的财富失衡,制裁搭便车者,并成功赢得多数投票。通过优化人类偏好,“民主AI”为与价值一致的政策创新提供了概念证明。表明深度强化学习可用于找到人们将在简单游戏中以多数票赞成的经济政策。因此,该论文解决了人工智能研究中的一个关键挑战——如何训练符合人类价值观的人工智能系统

论文题目:Human-centred mechanism design with Democratic AI
详细解读:https://www.aminer.cn/research_report/62e0b6ae7cb68b460ff503f0icon-default.png?t=M666https://www.aminer.cn/research_report/62e0b6ae7cb68b460ff503f0
AMiner链接:https://www.aminer.cn/?f=cs

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值