动态规划2

转载 2006年06月04日 17:47:00

动态规划的基本知识

 

动态规划是研究一类最优化问题的方法,在经济、工程技术、企业管理、工农业生产及军事等领域中都有广泛的应用。近年来,在ACM/ICPC中,使用动态规划(或部分应用动态规划思维)求解的题不仅常见,而且形式也多种多样。而在与此相近的各类信息学竞赛中,应用动态规划解题已经成为一种趋势,这和动态规划的优势不无关系。
    1、动态规划的常用名词
    在学习动态规划之前,先得对下面的名词有所了解。本书将标准名词作了一些简化,便于大家更好的理解。
    (1)状态(smte)
    对于一个问题,所有可能到达的情况(包括初始情况和目标情况)都称为这个问题的一个状态。
    (2)状态变量(sk)
    对每个状态k关联一个状态变量sk,它的值表示状态k所对应的问题的当前解值。
    (3)决策(decision)
    决策是一种选择,对于每一个状态而言,你都可以选择某一种路线或方法,从而到达下一个状态。
    (4)决策变量(dk)
    在状态k下的决策变量dk的值表示对状态k当前所做出的决策。
    (5)策略
    策略是一个决策的集合,在我们解决问题的时候,我们将一系列决策记录下来,就是一个策略,其中满足某些最优条件的策略称之为最优策略。
    (6)状态转移函数(t)
    从一个状态到另一个状态,可以依据一定的规则来前进。我们用一个函数t来描述这样的规则,它将状态i和决策变量di映射到另一个状态j,记为t(i,di)=j
    (7)状态转移方程(f)
    状态转移方程f描述了状态变量之间的数学关系。一般来说,与最优化问题相应,状态转移方程表示si的值最优化的条件,或者说是状态i所对应问题的最优解值的计算公式,用代数式表示就是:
    si=f({(sj,dj)|i=t(j,dj),对决策变量dj所有可行的取值})
    2、最优化原理
    1951年美国数学家R.Bellman等人,根据一类多阶段问题的特点,把多阶段决策问题变换为一系列互相联系的单阶段问题,然后逐个加以解决。一些静态模型,只要人为地引进“时间”因素,分成时段,就可以转化成多阶段的动态模型,用动态规划方法去处理。与此同时,他提出了解决这类问题的“最优化原理”(Principle of optimality):
    “一个过程的最优决策具有这样的性质:即无论其初始状态和初始决策如何,其今后诸策略对以第一个决策所形成的状态作为初始状态的过程而言,必须构成最优策略”。简言之,一个最优策略的子策略,对于它的初态和终态而言也必是最优的。
    这个“最优化原理”如果用数学化一点的语言来描述的话,就是:假设为了解决某一优化问题,需要依次作出n个决策D1,D2,…,Dn,如若这个决策序列是最优的,对于任何一个整数k,1 < k < n,不论前面k个决策是怎样的,以后的最优决策只取决于由前面决策所确定的当前状态,即以后的决策Dk+1,Dk+2,…,Dn也是最优的。
    最优化原理是动态规划的基础。任何一个问题,如果失去了这个最优化原理的支持,就不可能用动态规划方法计算。
    3、什么是动态规划
    动态规划是运筹学的一个分支。与其说动态规划是一种算法,不如说是一种思维方法来得更贴切。因为动态规划没有固定的框架,即便是应用到同一道题上,也可以建立多种形式的求解算法。许多隐式图上的算法,例如求单源最短路径的Dijkstra算法、广度优先搜索算法,都渗透着动态规划的思想。还有许多数学问题,表面上看起来与动态规划风马牛不相及,但是其求解思想与动态规划是完全一致的。
    因此,动态规划不像深度或广度优先那样可以提供一套模式,需要的时候,取来就可以使用;它必须对具体问题进行具体分析处理,需要丰富的想象力去建立模型,需要创造性的思想去求解。
    4、动态规划适于解决什么样的问题
    准确地说,动态规划不是万能的,它只适于解决一定条件的最优策略问题。
    或许,大家听到这个结论会很失望:其实,这个结论并没有削减动态规划的光辉,因为属于上面范围内的问题极多,还有许多看似不是这个范围中的问题都可以转化成这类问题。
    上面所说的“满足一定条件”主要指下面两点:
    (1)状态必须满足最优化原理
    (2)状态必须满足无后效性
    所谓的无后效性是指:“过去的决策只能通过当前状态影响未来的发展,当前的状态是对以往决策的总结”。
    这条特征说明什么呢?它说明动态规划适于解决当前决策和过去状态无关的问题。状态,出现在策略的任何一个位置,它的地位都是相同的,都可以实施同样的决策。这就是无后效性的内涵。 
    5、用动态规划解题的好处
    说了这么多的动态规划,它到底给我们解题能带来什么好处呢?
    其实动态规划的最大优势在于它具有极高的效率,而且动态规划还有其他的优势,例如:动态规划可以得出一系列解,算法清晰简便,程序易编、易调,等等。

动态规划2

  • 2008年04月16日 12:48
  • 817KB
  • 下载

(lecture_13)动态规划(2)

  • 2009年09月03日 23:06
  • 396KB
  • 下载

动态规划(2)——01背包

动态规划,给定n种物品和一个背包。物品i的重量是wi,其价值位vi ,背包的容量为C。问应该如何选择装入背包的物品,使得转入背包的物品的总价值为最大?在选择物品的时候,对每种物品i只有两种选择,即装入...

程序设计基础12_2_动态规划

  • 2016年01月28日 23:21
  • 552KB
  • 下载

动态规划2-张惜今

  • 2013年04月12日 14:18
  • 803KB
  • 下载

《动态规划》 输入两个整数 n 和 m,从数列1,2,3.......n 中 随意取几个数, 使其和等于 m

这是一道中兴的面试题 题目: 输入两个整数 n 和 m,从数列1,2,3.......n 中 随意取几个数, 使其和等于 m ,要求将其中所有的可能组合列出来. ...

4动态规划(2).rar acm算法

  • 2011年05月15日 12:48
  • 129KB
  • 下载

2007动态规划2.ppt

  • 2008年11月27日 11:38
  • 154KB
  • 下载

经典算法设计:动态规划(2)字符串匹配

1字符串匹配问题       在一篇英文文章中查找指定人名,人名使用26个字母(可以是大写也可是小写),空格及两个通配符(*或?),通配符*表示零个或多个任意字母,通配符?表示一个任意字母,如J*Sm...
  • gds2014
  • gds2014
  • 2015年12月30日 22:04
  • 596

动态规划-2

  • 2014年06月02日 09:36
  • 34KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:动态规划2
举报原因:
原因补充:

(最多只允许输入30个字)