RoboCup机器人仿真2D相关技术介绍

RoboCup仿真2D是人类足球比赛的模拟
(1)RoboCup仿真2D利用计算机模拟2D环境下的机器人进行足球比赛
(2) 比赛平台的设计充分体现了控制、通讯、传感和人体机能等方面的实际限制
(3)仿真2D机器人足球的研究重点放在于球队的高层功能:个人技术、局部战术、全局策略等
仿真2D机器人平台的特点
仿真2D平台提供了一个全分布的、包括合作与对抗的多智能体实时环境,具有如下特点:
(1)问题规模巨大 - 状态空间和动作空间都是连续的
(2)大量不确定因素
(3)环境部分可观察且存在噪音
(4)行动结果具有不确定性
(5)受限的通信模型
(6)对手模型未知
(7) 实时系统

主要研究背景
(1)信息的不确定性,不完全性
2D里面的视觉信息是个典型例子
(2) 行动的不确定性
所有2D足球里面的行动都有很大误差
(3)多智能体博弈,决策
11个敌方球员,10个我方球员
(4)超大规模
行动和状态全是巨大的连续空间

智能体,决策和博弈
(1) 自主智能体是指那些于复杂动态环境中,自治地 感知环境信息,自主采取行动,并实现一系列预先设定的目标或任务的计算系统。
2D仿真是个典型的多智能体决策问题。
决策问题的建模往往又基于状态和效用。
效用理论:反应智能体在世界状态之间的偏好。
(2)博弈
经典问题:囚徒困境
这里写图片描述
对2D来说问题对手模型未知,问题规模巨大,不确定性强。
(3)决策
1)搜索算法
状态抽象
深度优先搜索
这里写图片描述

  启发式搜索:优先扩展那些“更有价值”的状态,如蚁群算法等

2)建模思路:基于MAXQ的分层分解模型
求解算法思路:启发式搜索
马尔可夫决策过程(Markov Decision Processes,MDPs):描述一个带有部分行动不确定性的理论框架。
框架包括状态(S),行动(A),行动转移函数(带有概率)(P(s,a,s’)),和收益函数R(s,a,s’),衰减因子r ([0,1])。
基本动作框架如下:
这里写图片描述
具体实现
(1) 不确定性
将所有不确定性统一抽象到状态转移的不确定性上, 用这个思路回避对手建模
(2)超大规模的决策空间
限制搜索的深度和广度,利用启发式和一些经验条件剪枝
(3)收益矩阵稀疏
把启发式作为收益函数针对不同的情况要做不同的调整和设定.

  • 3
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
·1.内容简介: --------------------------------------------------------------- 这是一个压缩包,里面是5个文件是东南大学Robocup3D仿真比赛的源代码。对于参加Robocup比赛绝对有帮助。学习别人如何组织代码,这样可以在一个更高的起点进行编程。 建议,对Robocup机器人比赛感兴趣或者东南大学以及其他高校的参赛同学下载学习。否则,会感觉我的文件都不知道什么东西。 --------------------------------------------------------------- ·2.资源使用方法 suse Linux 环境下编译运行,注意,必须安装好开发环境和仿真环境。 --------------------------------------------------------------- ·3.文件组成形式 格式:tar.gz 源代码,在src文件夹里 --------------------------------------------------------------- ·4. wogeguaiguai的附言: 1.我的其他数学建模精华资源也欢迎您下载,大学生基本上都听过这个比赛吧,这个比赛比较有意思,而且获奖比例高。我的资料都是非常好的准备比赛要用的资料。我比赛结束之后,这些资料就不用啦,分享给大家!俺一年的搜索资源,同学们一朝即可获得! 2.下载本文件后,您可以获得所有信息,不必再零散下载,给您带来很大的方便。 3.10个资源分,绝对物超所值。评论后,您就可以获得11个资源分,欢迎您评论! --------------------------------------------------------------- ·5.如有问题,请在此留言,谢谢。 --------------------------------------------------------------- ·6.上传时间 2010-2-24-night

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值