Unity 强化学习初探之ML-Agent

在论文上看到Unity作为强化学习工具,一直想要进行学习和探索,在自己实际操作过后进行总结,将自己在操作过程当中遇到的问题进行记录。

代码链接:https://github.com/Unity-Technologies/ml-agents

论文链接:Unity: A General Platform for Intelligent Agents

博客链接:Unity强化学习之ML-Agents的使用

测试环境

Anconda3

Unity2021

python3.7

pytorch

创建虚拟环境

使用conda命令创建名称为Unity python版本为3.7的虚拟环境。

#创建环境
conda create -n Unity python=3.7
#激活环境
conda activate Unity
安装下载的安装包

在下载的文件夹当中打开终端,使用如下命令切换到相应目录下并使用pip指令安装

cd ml-agents
pip install .
cd ..
cd ml-agents-envs
pip install .

一定要注意install之后的 点。

导入工程文件

打开unity编辑器,选择project导入文件,路径如下图所示:

在编辑器界面选择ML-Agents,依次点击Example,3DBall, scenes, 双击3Dball,即可看到如下画面:

看到上图表示已经导入成功。

开始训练

在官方给的文件夹之下(ml-agent-develop),打开终端,激活虚拟环境,执行如下命令:

mlagents-learn config/ppo/3DBall.yaml --run-id=3DBall --force

默认使用ppo算法,读取3DBall.yaml文件,运行的名称是3DBall,--force是强制执行,如果没有其他错误,会出现如下界面:

点击unity编辑器中的三角形播放信号,可以看到已经动起来的ML-Agent,使用原始的数据一般不会有很好的训练效果,可有尝试将epsilon调到较小的值,一般为0.0001级别,即可获得较好的效果。

查看训练效果

在官方文件目录下有results文件夹,找到3DBall训练文件,有一个名为3DBall.onnx的文件,将此模型导入到项目当中,一般可以直接拖入到文件夹当中,将文件拖到Behavior Parameter组件当中的model,点击播放按钮即可看到效果。模型加载位置我已经圈出。

Tensorboard使用

关于tensorboard的使用,最重要的就是路径的问题,关于踩坑,我将博客文件放在下面。大家查看就好ubuntu18.04 下使用tensorboard出现错误的解决方法

总结

本文对初学ML-Agents过程进行了简单的记录,不涉及复杂的算法部分,只是简单的运行,修改参数,方便各位初学者学习和使用,适合小白和初学者,也欢迎大佬前来指导。

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
回答: Unity是一款备受欢迎的游戏引擎,而ML-Agents是Unity中的一个插件,用于开发游戏和实现强化学习算法。Unity3D早就有了开发自己强化学习环境的想法,并且提供了相应的工具和示例项目。你可以使用UnityML-Agents插件来创建自己的强化学习智能体,并通过编写代码来定义智能体的行为和决策过程。你可以使用UnityML-Agents插件来处理传感器数据、执行动作,并通过训练算法来优化智能体的决策能力。在Unity中实现强化学习需要使用ML-Agents插件提供的API和功能,如Actuators来执行动作,Sensors来接收环境的状态信息。同时,Unity也在不断发展和探索使用深度学习方法来学习游戏行为,控制复杂的NPC行为和游戏动态等。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [Unity强化学习ML-Agents的使用](https://blog.csdn.net/tianjuewudi/article/details/121115480)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *3* [unity3d ai学习_Unity AI –通过Q学习进行强化学习](https://blog.csdn.net/culiao6493/article/details/108642015)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值