动态规划

动态规划是一种求解多阶段决策问题的数学方法,由贝尔曼提出。它广泛应用于最短路线、库存管理和资源分配等问题。动态规划具有最优子结构特性,确保了任何最优解都包含子问题的最优解。通过设置状态数组,确定状态间的递推关系,可以逐步求解最优值。动态规划的实施包括阶段划分、状态表示、递推计算和构造最优解四个步骤。
摘要由CSDN通过智能技术生成
  1. 动态规划概述
    动态规划是运筹学的一个分支,是求解决策过程最优化的数学方法。20世纪50年代美国数学家贝尔曼(Rechard Bellman)等人在研究多阶段决策过程的优化问题时,提出了著名的最优性原理,把多阶段决策过程转化为一系列单阶段问题逐个求解,创立了解决多阶段过程优化问题的新方法——动态规划。
    动态规划问世以来,在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。例如最短路线、库存管理、资源分配、装载等问题,用动态规划方法比用其它方法求解更为方便。
  2. 动态规划概念
    动态规划所处理的对象是多阶段决策问题。多阶段决策问题,是指这样的一类特殊的活动过程,问题可以分解成若干相互联系的阶段,在每一个阶段都要做出决策,形成一个决策序列,该决策序列也称为一个策略。对于每一个决策序列,可以在满足问题的约束条件下用一个数值函数(即目标函数)衡量该策略的优劣。多阶段决策问题的最优化求解目标是获取导致问题最优值的最优决策序列(最优策略),即得到最优解。
    例子 已知6种物品和一个可载重量为60的背包,物品i(i=1,2,…,6)的重量分别为(15,17,20,12,9,14),产生的效益分别为(32,37,46,26,21,30)。在装包时每一件物品可以装入,也可以不装,但不可拆开装。确定如何装包,使所得装包总效益最大。
    这就是一个多阶段决策问题,装每一件物品就是一个阶段,每一个阶段都要有一个决策:
    这一件物品装包还是不装。
    这一装包问题的约束条件为:
    目标函数为:
    对于这6个阶段的问题&#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值