强化学习
Woodii
是个程序员(自愿的),是个学生(永久的)
展开
-
强化学习-1-基础原理及原理及马尔可夫决策流程(MDP)
最近在做实习生, 公司大佬们都很忙, 正好这边有个强化学习的项目我也有基础, 于是就交给我研究一下, 借这个机会我也重新去复习一下强化学习的相关知识并做记录, 希望能写成一个教程的模式, 如果能有帮助不胜荣幸, 本人也很菜如果有错误还望指正海涵一. 什么是强化学习强化学习(英语:Reinforcement learning,简称RL)是机器学习中的一个领域,强调如何基于环境而行动,以取得...原创 2019-08-04 15:31:06 · 792 阅读 · 0 评论 -
强化学习2-策略,状态值函数,动作值函数
a原创 2019-08-30 15:07:10 · 9090 阅读 · 4 评论