第九章 (一)动态规划

 

 动态规划=分治(不是等分,是多阶段)+避免重复计算

是一个多阶段决策问题

核心是状态和状态转移方程

 

 

数字三角问题(单向无环最长/最短路径问题):

现有一张地图,各结点代表城市,两结点间连线代表道路,线上数字表示城市间的距离。如图所示,试找出从结点A到结点E的最短距离

递推公式(状态转移方程):

 递归

如果用递归的方法,独立性太强而这种dp问题各个阶段之间具有联系,如果用递归就会有大量的重复计算(不仅仅是某个节点的重复而是这个节点的子树的重复计算)

为了避免重复计算,我们应该把已经得到的结果保留下来。将计算变为查询,用空间换取时间。

下面给出两种实现思路:

递推:使用递推公式,由底向顶填表

记忆化搜索(保证每个节点只访问一次也是需要记录)

 

数学模型

动态规划模型的基本要素

1.阶段
阶段(step)是对整个过程的自然划分。通常根据时间顺序或空间特征来划分阶段,以便按阶段的次序解优化问题。阶段变量一般用k=1,2,..,n表示。

2.状态
状态(state)表示每个阶段开始时过程所处的自然状况。它应该能够描述过程的特征并且具有无后向性,即当某阶段的状态给定时,这个阶段以后过程的演变与该阶段以前各阶段的状态无关,即每个状态都是过去历史的一个完整总结。通常还要求状态是直接或间接可以观测的。
描述状态的变量称状态变量(state variable)。变量允许取值的范围称允许状态集合(set of admissible states)。用xk表示第k阶段的状态变量,它可以是一个数或一个向量。用Xk表示第k阶段的允许状态集合。在引言的例子中x2可取B1,B2,X2={B1,B2}。
n个阶段的决策过程有n+1个状态变量,xn+1表示xn演变的结果

3.决策
 当一个阶段的状态确定后,可以作出各种选择从而演变到下一阶段的某个状态,这种选择手段称为决策(decision) 。
 描述决策的变量称决策变量(decision variable)。变量允许取值的范围称允许决策集合(set of admissible decisions)。用uk(xk)表示第k阶段处于状态xk时的决策变量,它是xk的函数,用Uk(xk)表示了xk的允许决策集合。在引言的例子中u2(B1)可取C1,C2,C3。决策变量简称决策。

4.策略
决策组成的序列称为策略(policy)。由初始状态x1开始的全过程的策略记作p1n(x1),即p1n(x1)={u1(x1),u2(x2),...,un(xn)}。由第k阶段的状态xk开始到终止状态的后部子过程的策略记作pkn(xk),即pkn(xk)={uk(xk),uk+1(xk+1),...,un(xn)}。类似地,由第k到第j阶段的子过程的策略记作pkj(xk)={uk(xk),uk+1(xk+1),...,uj(xj)}。对于每一个阶段k的某一给定的状态xk,可供选择的策略pkj(xk)有一定的范围,称为允许策略集合(set of admissible policies),用P1n(x1),Pkn(xk),Pkj(xk)表示。

5.状态转移方程
在确定性过程中,一旦某阶段的状态和决策为已知,下阶段的状态便完全确定。用状态转移方程(equation of state)表示这种演变规律,写作:

 引言中例子的状态转移方程为:xk+1=uk(xk)

6.指标函数和最优值函数 

指标函数(objective function)是衡量过程优劣的数量指标,它是关于策略的数量函数,从阶段k到阶段n的指标函数用Vkn(xk,pkn(xk))表示,k=1,2,...,n。

能够用动态规划解决的问题的指标函数应具有可分离性(可以将大问题分解为子问题),即Vkn可表为xk,uk,Vk+1 n的函数,记为:(可以看出来这个结构是递归的)

 

 

动态规划算法的基本步骤

1.分析最优解的性质,并刻划其结构特征。 (无后向性)
2.递归地定义最优值。
3.以自底向上的方式或自顶向下的记忆化方法(备忘录法)计算出最优值。
4.根据计算最优值时得到的信息,构造最优解。

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 《姜启源 数学模型txt》是一本关于数学模型的TXT文档。姜启源是作者的名字,他在这本书中向读者介绍了数学模型的概念、原理和应用。数学模型是用数学语言和符号描述和分析现实问题的工具和方法。它可以帮助人们将复杂的现实问题转化为可计算、可解析的数学问题,从而提供解决问题的指导方向。 这本书的内容丰富多样,涵盖了数学模型的基本知识和技巧,如建立数学模型的步骤、选择合适的数学方法和技术等。姜启源通过具体的实例和案例,向读者展示了数学模型在各个领域的应用,如物理、生物、经济等。他还介绍了一些常用的数学模型,如线性模型、非线性模型、随机模型等,并详细讲解了它们的原理和特点。 这本书不仅适合数学专业的学生和研究人员阅读,也可以作为其他科学领域的从业者了解数学模型的入门书籍。姜启源用通俗易懂的语言和清晰简洁的表达方式,使得读者能够轻松理解和掌握数学模型的基本理论和方法。同时,他还强调了数学模型的局限性和应用中的注意事项,帮助读者理性地应用数学模型解决实际问题。 总体而言,《姜启源 数学模型txt》是一本权威且实用的数学模型入门书籍,无论你是对数学感兴趣的读者还是需要解决实际问题的专业人士,都可以从中获得丰富的知识和实用的技巧。 ### 回答2: 姜启源的数学模型.txt是一份关于数学建模的文档。数学模型是数学方法在实际问题中的应用,它通过一系列的数学描述和公式,对问题进行抽象、分析、求解,并提供定量的解决方案。 姜启源可能是文档的作者,他可能是一个数学学者、研究人员或者数学建模领域的专家。在该文档中,他介绍了数学模型的定义、分类、建立过程以及应用领域等内容。他可能探讨了数学模型在经济、生物、物理、工程等多个领域的应用实例,以及数学模型的优点和局限性。 数学模型可以帮助我们理解和解决实际问题。它通过描述和分析问题的关键要素,建立数学表示,从而将复杂问题简化为可计算的形式。数学模型可以预测和优化系统的行为,提供决策支持,促进科学研究的推进。 姜启源的数学模型.txt可能包含了数学建模的基本原理和方法,包括数学分析、微分方程、优化算法等。他可能对常见数学模型的求解方法进行了介绍,如线性规划、最小二乘法、动态规划等。 总之,姜启源的数学模型.txt是一份关于数学建模的文档,它提供了关于数学模型的定义、分类、建立过程以及应用领域的信息。通过数学模型,我们可以更好地理解和解决实际问题,为决策和科学研究提供支持。 ### 回答3: 《姜启源 数学模型txt》是指姜启源先生编写的关于数学模型的文本。姜启源是一位著名的数学家和教育家,他在数学研究和教育方面有很高的造诣。 这个txt文档可能包含了姜启源对数学模型的理论、方法和应用的深入探讨。数学模型是一种抽象的描述方法,用数学语言和符号来表示和解决实际问题。姜启源可能会介绍数学模型的基本原理、建立和求解的步骤,以及在不同领域和实际问题中的应用案例。 在文本中,姜启源可能会从数学模型的起源和发展历程开始介绍,探讨数学模型的分类和特点,并引用相关的数学定理和方法来支持他的观点。他可能还会解释数学模型与实际问题之间的联系,探讨数学模型在现实生活中的重要性和应用价值。 此外,文本中可能还包含了姜启源对数学模型研究的未来发展的展望。他可能会提出一些数学模型研究的挑战和问题,并探讨未来的研究方向和趋势。 总体而言,姜启源的《数学模型txt》可能会是一本系统、全面而深入的关于数学模型的文本,对于对数学模型感兴趣的读者和专业人士会有很大的帮助和启发。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值