强化学习
文章平均质量分 88
洛克-李
希望往数据挖掘方向发展。学习更多,使自己越来越强大
展开
-
AI也可以玩精灵宝可梦了!
相信很多人童年都玩过《宝可梦》游戏,在这个游戏里面,我们会扮演玩家一路闯关,打赢8个道馆并挑战四大天王,最后获得冠军的梦想。游戏的主要玩法就是收服宝可梦,然后一路对战升级。小时候总使幻想着宝可梦能够根据对手,来进行自主战斗。这不,有国外玩家在宝可梦游戏中花费5年训练AI。并且AI在游戏中玩了两万多局游戏在一开始的时候,这个AI只能够乱按各种按钮,并且不懂得如何捕捉宝可梦和进行有效的对战。在经历了5年的时间,这个AI能够知道如何捕捉宝可梦,并且让他们进化,然后击败道馆馆长。原创 2023-10-30 10:27:43 · 89 阅读 · 0 评论 -
一个AI玩遍多个游戏
前面我曾经介绍过很多在游戏圈比较出名的AI智能体。这些AI智能体往往能在MOBA类游戏和即时战略游戏中超越专业选手,例如腾讯在王者荣耀训练出来的“”:DeepMind在星际争霸中训练出来的“”:这其中,OpenAI利用玩家视频来学习,训练出超大的预训练模型,这个AI智能体能够在开放自由世界中进行探索:但是上面所介绍的AI智能体,往往仅能使用在在某个单独的游戏。因此为了让一个AI智能体能够学会游玩多个游戏,谷歌提出了一个新的**决策Transformer模型。......原创 2022-08-28 10:52:59 · 1316 阅读 · 0 评论 -
构建你的第一个强化学习AI智能体(微信“跳一跳”)
最近在学习一些关于强化学习的知识。当然仅仅学习理论知识还是不够的,还是需要从实际案例上进行出发,利用强化学习搭建自己的AI智能体。一般来说,强化学习第一个案例都是用“cartpole”,也即是在一个平衡木上保持木杆不下落:但是这个案例一般离我们生活比较远,因此本入门案例使用了微信“跳一跳”作为强化学习的目标。在本案例中,大体框架如下:首先简要介绍一下强化学习和DDPG算法的一些背景知识。强化学习不同于传统的有监督学习,它本身没有有标签数据进行学习,只能通过不断的试错,来提升自己。在试错的过程中,就需要不原创 2022-07-13 20:37:30 · 1440 阅读 · 0 评论