openai dota2 细节

openai dota2 细节

  1. ai直接读引擎数据,大约有2000个数据
  2. 有部分子目标是由既了解dota2又了解优化算法的人预先设定的,比如击杀敌方英雄,自己死亡,塔的价值等的奖励函数都是预先写死的
  3. 没有使用simulation
  4. ai乱插眼,是因为插眼的价值函数很难判断,开发人员允许比赛中ai插眼,只能为了看ai的表现,希望有所收获
  5. ai喜欢去看肉山,是因为开发人员在训练的时候把肉山的血量随机生成,方便ai明白肉山的重要性。否则单个ai去打肉山几乎永远无法获胜,多个ai集合在肉山附近,又几乎不可能。只能把肉山血量调低,这样ai就有机会击败肉山,明白这一行为的重要性
  6. 第三局,当ai处于严重劣势的时候,表现的无所适从。这是因为训练的ai,只是自己和自己打,双方旗鼓相当,对于崩盘的情况很少碰到,无法做出有效应对
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值