![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
比赛专题
文章平均质量分 96
微笑小星
强化学习的信仰者,游戏开发的爱好者。
展开
-
AI球球大作战:Go-Bigger多智能体决策智能挑战赛
比赛网页:https://www.datafountain.cn/competitions/549repo:https://github.com/opendilab/Gobigger-Explore/入门篇赛题说明本次竞赛采用 Go-Bigger 作为游戏环境。Go-Bigger 是一款多人组队竞技游戏。更多细节请参考 Go-Bigger 文档。在游戏中,每支竞赛参赛队伍控制游戏中一支队伍(每支队伍由多个玩家组成)。竞赛参赛队伍需要通过提交智能体的方式,来对游戏中的某个队伍及其所包含的玩家进行控制,原创 2022-03-14 23:15:50 · 1775 阅读 · 3 评论 -
强化学习落地挑战赛:学习指定平等的促销策略(训练流程)
赛事官方入口:https://codalab.lisn.upsaclay.fr/competitions/823#learn_the_details-overview深度强化实验室的中文说明:http://deeprl.neurondance.com/d/583-aihttp://deeprl.neurondance.com/d/584-ai本文的内容基于前面的文章:赛题分析:AI决策•强化学习落地挑战赛——学习指定平等的促销策略这里直接讲述训练过程。原创 2022-02-18 22:35:00 · 592 阅读 · 5 评论 -
赛题分析:AI决策•强化学习落地挑战赛——学习指定平等的促销策略
现在商家想要将促销策略从个性化促销转换为平等化促销,执行的方式是发放优惠券,我们可以通过控制优惠券的数量和折扣来达成目标,通过对不同的消费者投放不同数量不同折扣的消费券来达成目的。对于非平等化促销策略,它输入单个用户状态,输出给单个用户发放的促销动作,因此每个人的促销动作可以各不相同。要学习一个平等化促销策略,它输入的是全体用户的状态,输出一个给全体用户发放相同的促销动作。原创 2022-01-02 17:23:07 · 1391 阅读 · 4 评论