博客专栏  >  互联网   >  强化学习

强化学习

本专栏主要介绍强化学习,包括代码实现

关注
1 已关注
1篇博文
  • K摇臂赌博机 --ε-贪心算法(原理与Python代码实现模拟)

    K摇臂赌博机   K摇臂赌博机对应单步强化学习模型,K摇臂赌博机有K个摇臂,赌徒投币后按下其中一个摇臂,摇臂以一定的概率 吐出硬币,赌徒事先并不知道每个摇臂吐出概率的的情况,需要使得赌徒获得硬币最...

    2018-01-28 22:59
    524

img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部