运筹学状态转移方程例子_专业课 | 运筹学动态规划笔记

本文介绍了运筹学中的动态规划,重点讲解了多阶段决策的特点和状态转移方程的概念。内容包括阶段和状态定义、决策变量与策略、状态转移方程和指标函数。此外,还探讨了动态规划的顺推和逆推解法,并列举了资源分配、生产与存储、背包问题等应用实例。
摘要由CSDN通过智能技术生成

【1】概念原理多阶段决策特点

▶多阶段决策是与时间相关的;

▶多阶段决策依赖于当前的状态;

▶每一个时段都要作出决策;

▶全部过程的决策是一个决策序列;

▶本段决策的执行将影响下一阶段的决策;

▶不仅要考虑本阶段最优,更要考虑全局最优;最优性原理

▶无论过去的状态和决策如何,对前面决策所形成的状态而言,余下的诸决策必须构成最优策略;

▶将决策问题划分为若干个阶段,全过程的优化问题就分解为子过程的优化问题,由后向前逐步倒推,最优化的子过程逐渐成为全过程最优;

▶作为全过程的最优策略P*1,n的组成部分的任一子策略P*k,n(Sk),一定是从状态Sk出发直至终点的最优策略。相关概念

▶阶段

将所给问题的过程,按时间或空间特征分解成若干相互联系的阶段,以便按次序去求每个阶段的解。常用字母k表示。

▶状态

各阶段开始时的客观条件。状态用变量Sk表示。

▶决策

确定下一阶段的状态,表示决策的变量称为决策变量,Uk(Sk)表示第k阶段的状态为Sk时的决策变量,它是状态变量的函数。

▶策略

各段决策确定后,整个问题的决策序列就构成一个决策序列。

▶状态转移方程

确定过程由一个状态到另一个状态的演变过程。若给定第k阶段状态变量Sk的值,如果该段的决策变量Uk一经确定,第k+1阶段的状态变量Sk+1的值也就完全确定。

▶指标函数(最优指标函数)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值