【Unity】 坦克寻路

本文探讨在Unity中使用机器学习为坦克实现寻路,遇到的问题及解决方案。作者尝试用NavMesh,但发现无法模拟坦克转向,转而使用机器学习。在训练过程中,坦克出现疯狂撞墙、左右横跳等问题。通过调整奖励函数和惩罚项,解决了部分问题,但最终因训练成本高和游戏场景复杂度,考虑手动实现寻路算法。
摘要由CSDN通过智能技术生成

这是一篇残缺不全的记录……

Unity寻路所有的资料大概都是NavMesh吧。本来这一块跟我没啥关系,后来队友告诉我:NavMesh没法模拟坦克的转向。
我也不知道是怎样勇气打算试一下机器学习?反正最后凉了想看解决方法的散了吧……

配环境啥的都不说了。
agent的移动方式是转向和向前向后运动,就是基本的坦克的运动。
提醒一个问题就是如果是用

Input.GetAxis("Vertical")

来判断方向的话,这个值在brain设置为player的时候是对的但是在训练的时候是0……

一开始设计的是

  • 奖励
    • +2 看到目标(正前方的射线检测到目标并且在一定距离内)
    • -0.01 每步
    • +0.02 如果这一次比上一次更接近目标点
    • -1 坦克掉下去
  • 重置条件
    • 坦克的 y < 正常值(掉了下去)
    • 目标的 y < 正常值(也是掉下去了)
    • 坦克长期不移动(可能卡在了哪里)
    • 目标在坦克视线范围内

我还加过一个重置条件是当超过一定时间还没有找到目标的时候,重置目标的位置。无法评价这个决策的好坏……就不在这里加了。

这样训练的结果是,坦克开始疯狂撞墙——可能是由于它找到目标的

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值