1、动态规划的基本概念有哪些?
阶段、(阶段)状态、状态变量si、状态集Si、决策、决策变量ui(si)、决策集Di(si)、状态转移方程、决策的指标函数、策略的指标函数、最优值函数等。
2、什么是阶段?
动态规划的阶段指的是决策发生的时间或空间区隔。
3、如何划分动态规划问题的阶段?
动态规划问题的阶段划分一般可依据决策发生的次数和每次决策发生并作用的时间段或空间段来定。
4、什么是(阶段)状态?
状态既可以指一个阶段上作决策时所依据的自然状况和客观条件,又可以指一个阶段上所作决策后的结局状况,故一个阶段的状态常有首、末状态之分,以区别阶段上决策的出发点和结局状况。但,一般地,人们往往仅选择各阶段的首、末状态之一,作为各阶段的状态,所以,当谈到各阶段的状态时,要么都指的是各阶段的首状态,要么都指的是各阶段的末状态。
在前面的概念中,我们看到了两种不同的状态表达方式:各阶段的首状态与各阶段的末状态
这里想要说的就是,当读者在做动态规划问题时:
(1)如果状态转移方程中的S(k)表示的是各阶段的首状态:即:S(k) =S(k-1) + x(k-1),此时使用逆推法; S(1) = 最大数量
(2)如果状态转移方程中的S(k)表示的是各阶段的末状态:即:S(k) =S(k-1) + x(k),此时使用顺推法。 S(n) = 最大数量
结论:
顺推法与逆推法中递推公式的不同导致使用顺推还是逆推方式的不同。
动态规划问题中,阶段状态的划分通常基于决策发生的时间或空间区隔。状态可以是阶段开始或结束时的情况。顺推法适用于状态转移方程中状态表示阶段末状态的情况,而逆推法则适用于状态表示阶段初状态。两种方法的递推公式有所不同,决定了使用顺推还是逆推策略。
1681

被折叠的 条评论
为什么被折叠?



