- 博客(1)
- 收藏
- 关注
原创 RL 强化学习笔记(一) 马科夫决策过程(MDP)
写博客的目的是总结自己的学习成果,希望能帮助到有需要的同学。 用到的数学知识: 条件概率分布: https://zh.wikipedia.org/wiki/%E6%9D%A1%E4%BB%B6%E6%A6%82%E7%8E%87%E5%88%86%E5%B8%83 期望: https://zh.wikipedia.org/wiki/%E6%9C%9F%E6%9C%9B%E5%80%BC ...
2019-04-06 22:13:06 1215
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人