恭喜,你已经成功地来到了
动态规划(入门)【不骗人,真的好理解的啦】(二)
那么接着上一次的问题(没有看过的可以看一下这一篇动态规划(入门)【不骗人,真的好理解的啦】(一)):我们用一家人传递水的事例来分析了什么叫作阶段与状态,
我们现在应该来讨论一下什么叫作决策。
决策
在对问题的处理中作出的每种选择性的行动就叫做决策。即从该阶段的每一个状态出发,通过一次选择性的行动转移至下一阶段的相应状态。
还是利用之前传水的例子:
这就好比你妈生了若干个child,然后让你们站成一排,让你的最大的哥哥/姐姐一直传一桶水到最状态小的口渴的弟弟或妹妹。
在这里面,每个人选择传,或不传(当然不传你妈打屎你跟你好好地谈人生)就叫做对这个传水的分问题的决策。
阶段变量,状态变量,决策变量
简单来说,阶段变量用来描述阶段的变量(tm这是什么解释),一般喜欢用k来表示 。在传水的例子中,假设你有10个兄弟姐妹,那么阶段变量就是k=1,2,3……10.
状态变量用来描述状态的变量(。。。),在传水的例子中,你兄弟姐妹的左右手都可以叫作状态变量(问:手怎么变??答:有没有力气啊!)
决策变量同理。
策略
在所以阶段构成的全过程中,各阶段的决策变量所组成的有序总体被称作策略。最优效果的策略叫作最优策略。
这时,我想到了中国策略第一家:
和他
状态转移方程
状态转移方程,是动态规划中本阶段的状态往往是上一阶段状态和上一阶段决策的结果。如果给定了第K阶段的状态Sk以及决策uk(Sk),则第K+1阶段的状态Sk+1也就完全确定。