现在ChatGPT非常的火,大家都使用大数据模型来生成内容,后续机器人,仿真机器人的行为控制,也将会是AI领域很火的一个方向之一,这个方向就可以和游戏高度契合,游戏通过3D角色来仿真,通过训练AI行为来控制机器人的一些动作与决策,今天我们以”足球游戏”为背景,来详细的讲解,如何基于 “左右互博”强化训练,让两对机器仿真的足球队员来进行智能的经行一场AI比赛。先来看下训练后的效果,如图:
先介绍一下训练环境, ML插件是针对Unity为AI 深度学习专门做的一个插件。它基于TensorFlow深度学习框架, 并针对游戏开发相关的AI训练与工具做了一层封装,引入了很多算法,能帮助我们轻松的训练出游戏AI与相关的工具。
本案例为本文根据双人足球基础之上尝试改进的五人足球。本案例使用了Unity的ML-Agents组件开发而成,这里使用了多智能体强化学习的算法MA-POCA,双方队伍相互学习相互博弈,促进共同进步,可以不断自我进化,从而成长为更加聪明的AI。在本案例中每一队分为前锋Striker、后卫Guard、守门员Goalie三个职业。其中前锋两人、后卫两人&#x