动态规划(一)

1.基本概念:动态规划是解决多阶段决策问题的一种方法。其中,多阶段决策问题是指:如果一类问题的求解过程可以分为若干个互相联系的阶段,在每一个阶段都需作出决策,并影响到下一个阶段的决策;问题的解决就是要在可以选择的那些策略中间,选取一个最优策略,使在预定的标准下达到最好的效果。

2.最优性原理:

a.不论初始状态和第一步决策是什么,余下的决策相对于前一次决策所产生的新状态,构成一个最优决策序列。

b.最优决策序列的子序列,一定是局部最优决策子序列。

c.包含有非局部最优的决策子序列,一定不是最优决策序列。

3.无后效性原则:

所谓无后效性原则,指的是这样一种性质:某阶段的状态一旦确定,则此后过程的演变不再受此前各状态及决策的影响。也就是说,“未来与过去无关”,当前的状态是此前历史的一个完整的总结,此前的历史只能通过当前的状态去影响过程未来的演变。

4.指导思想:

a.在做每一步决策时,列出各种可能的局部解

b.依据某种判定条件,舍弃那些肯定不能得到最优解的局部解。

c.以每一步都是最优的来保证全局是最优的。

5.基本特征:

a.问题具有多阶段决策的特征。

b. 每一阶段都有相应的状态与之对应,描述状态的量称为状态变量

c.每一阶段都面临一个决策,选择不同的决策将会导致下一阶段不同的状态。

d.每一阶段的最优解问题可以递归地归结为下一阶段各个可能状态的最优解问题,各子问题与原问题具有完全相同的结构。

6.几个概念:

a.阶段:据空间顺序或时间顺序对问题的求解划分阶段。

b.阶段变量:描述阶段的变量称为阶段变量,通常用k表示。

c.状态:描述事物的性质,不同事物有不同的性质,因而用不同的状态来刻画。对问题的求解状态的描述是分阶段的。

d.状态变量:一般地,状态可由变量来描述,用来描述状态的变量称为状态变量。

e.决策:根据题意要求,对每个阶段所做出的某种选择性操作。

f.决策变量:一个实际问题可能要有多次决策和多个决策点,在每一个阶段的每一个状态中都需要有一次决策,决策也可以用变量来描述,称这种变量为决策变量。

g.决策允许集合:在实际问题中,决策变量的取值往往限制在某一个范围之内,此范围称为决策允许集合。

h.策略和最优策略:所有阶段依次排列构成问题的全过程。全过程中各阶段决策变量所组成的有序总体称为策略。在实际问题中,从决策允许集合中找出最优效果的策略称为最优策略。

i.状态转移方程:用数学公式描述与阶段相关的状态间的演变规律。

7.一般解题步骤:

a.判断问题是否具有最优子结构性质,若不具备则不能用动态规划。

b.把问题分成若干个子问题(分阶段)。

c.建立状态转移方程(递推公式)。

d.找出边界条件。

e.将已知边界值带入方程。

f.递推求解。


ps:至于典型例题我还有好多没看,今天先总结一下我看的基本概念啦,明天一起总结一下看过的典型例题~~

       希望能在自己的不懈努力下,把这门语言学好~~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值