备战蓝桥杯---动态规划(理论基础)

动态规划是一种解决多阶段决策过程最优化的方法,通过将问题分解为子问题并应用最优子结构和无后效性原则。实现方式包括递推和记忆化搜索。举例说明了如何处理具有余数问题和楼梯问题,以适应特定条件下的决策过程。
摘要由CSDN通过智能技术生成

目录

动态规划的概念:

解决多阶段决策过程最优化的一种方法

阶段:

状态:

决策:

策略:

状态转移方程:

适用的基本条件

1.具有相同的子问题

2.满足最优子结构

3.满足无后效性

动态规划的实现方式:


动态规划的概念:

解决多阶段决策过程最优化的一种方法

阶段:

把问题分成几个相互联系的有顺序的环节。

状态:

某一阶段的出发位置

决策:

从某一状态演变到下一个状态的选择

策略:

从开始到终点的决策序列。

状态转移方程:

从i到i+1状态的演变规律。

适用的基本条件

1.具有相同的子问题

(1)保证这个问题可以分解成几个子问题并且可以用他们来解决这个问题。

(2)这些子问题也可以分解成相同的子问题。

2.满足最优子结构

问题的最优解包含着他的子问题的最优解,即此后决策必须基于上一次产生的最优决策。

举个栗子:

假如A是当前的最优策略,那么,我们要保证下一次的最优解一定是在A的基础上产生的,而不能是由当前的不是最优的策略导出的。

其实,动态规划是一种分阶段贪心的过程,我们要确保最长远的利益来自于每一步当前的最优利益。

就像这一题,我们选一个路径使他们的和%4最小,显然,如果我们只求当前%4的最小值,无法推出来下一步的最优解。

像这样的情况,我们可以重新考虑状态转移方程,我们发现,每一个余数都有存在的价值,于是我们可以把存在的余数记下来,再用他们去求下一个状态。

3.满足无后效性

要包含所有影响答案的因素,即它用于解决当前问题与过去状态无关的问题

举个例子:

大家应该都写过走楼梯的递归问题。a[i]=a[i-1]+a[i-2]。但是,如果有这么一个规定:走过50楼的人不能再走100楼,显然这样子在100楼时,我们不知道前面的99与98是否走过。

于是,我们应该再记录一个值表示是否踏过50,

我们不妨记f[i][0]为没有上过50,f[i][1]为上过50,这样的话,我们在i<50前用f[i][0]=f[i-1][0]+f[i-2][0]; f[i][1]=0;

i==50: f[50][0]=0,f[50][1]=f[49][0]+f[48][0],

i>50&&i<100: f[i][0]=f[i-1][0]+f[i-2][0],f[i][1]=f[i-1][1]+f[i-2][0];

i==100:f[100][0]=f[99][0]+f[98][0],f[100][1]=0;

i>100:f[i][0]=f[i-1][0]+f[i-2][0];f[i][1]=f[i-1][0]+f[i-2][0];

动态规划的实现方式:

1.递推(直接用for循环)

2.记忆化搜索

  • 26
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值