- 博客(1)
- 收藏
- 关注
原创 强化学习基础——形象化解释值函数含义以及期望的意义
1.值函数定义1.1 V函数我们先看一下经典的最短路问题,假设我们要求出起点s到终点g的最短路我们定义V∗(s)V^\ast(s)V∗(s)为sss到终点ggg的最短路,V∗(f)V^\ast(f)V∗(f) 为fff到终点ggg的最短路,以此类推,为了求出这个最短路,我们从终点开始算起:V∗(g)=0V∗(f)=1+V∗(g)=1V∗(d)=min{3+V∗(g),1+V∗(f)}\...
2019-09-17 10:53:59 1425 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人