多智能体强化学习

多智能体强化学习

学习链接

内容摘要

在即将来临的物联网时代,群体决策智能将称为一个研究重点。
传统上,博弈论研究的多个智能体的理性决策问题。它定义了动作、收益等博弈基本概念,侧重分析理性智能体的博弈结果,即均衡。然而,在很多现实问题中,博弈的状态空间和动作空间都很大,智能体的绝对理性是很难实现的,智能体往往处在不断的策略学习过程中。因此,近年来兴起的多智能体强化学习主要研究智能体策略的同步学习和演化问题,它在无人机群控制、智能交通系统、智能工业机器人等场景中具有很大的应用前景。

人工智能的发展趋势

智能感知----->智能决策------>智能群体决策
群体智能决策问题场景:游戏、工业场景(无人机群、交通系统、物流配送)、社会场景(区域经济预测)

博弈论

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

多智能体强化学习

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
开放性问题

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

研究展望

在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值