动态规划1-问题初步

亲爱的们,很久没更博了,因最近事情较忙,前端的技术分享落一段落,之后有机会再写一写。
在准备秋招,最近准备分享一波刷题的心得。准备从最经典的动态规划开始本系列的分享。

为什么使用动态规划算法

我们先回忆一下贪心问题。

贪心又称贪婪算法。是一种在每一步选择中都采取在当前状态下最好或最优(即最有利)的选择,从而使得问题得到全局最优解。

它的特点:

贪心选择性质是指所求问题的整体最优解可以通过一系列局部最优的选择,即贪心选择来达到。

这是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。

贪心选择性质就是,该问题的每一步选择都在选择最优的情况下能够导致最终问题的答案也是最优。

或者说是无后效性,如果该问题的每一步选择都对后续的选择没有影响,就可以是应用贪心算法。

同样都是解决多过程决策问题,贪心算法需要每个过程无后效性。

当问题的每个决策过程具有后效性的话就不能采用贪心算法。

所以我们需要学习动态规划算法,去解决贪心解决不了的问题。

多阶段决策过程最优化问题

动态规划问题,是运筹学的一个分支,动态规划主要用于求解以时间划分阶段的动态过程的优化问题。

在实际生活中,动态规划问题与贪心问题相似,都是完成某一事件的过程可以划分成多个阶段。

但是与贪心不同的是动态规划的每个状态之间都会相互影响和相互干涉,也就是说在某一阶段做出的决策会影响整个事件的最终结果。

因为阶段是有先后的,所以某一阶段的选取受之前阶段的影响,他也会影响后面的阶段。

多阶段决策问题:

多阶段决策过程问题,就是一类在每一阶段都需要做出选择,且某一阶段的决策受前面所有阶段决策后的状态影响,他的决策又会影响后续的决策。

这样一类问题就是多阶段决策问题。

多阶段决策过程最优化问题:

在多阶段决策问题中,各个阶段采取的决策,通常与时间相关,但有时又与其他的线性的变量相关。

我们前面说到,某个阶段的决策是在前面做完了的决策引发的某一个状态开始进行决策的。

而现在做的决策又会使得状态进行转移,那么又影响了下次进行决策的状态。

所以说作决策时的状态是动态的,规划是解决最优化问题的方式,所以解决这种多阶段决策过程最优化的方法叫做动态规划。

动态规划中的术语解释

  • 阶段: 把所给求解问题的过程恰当地分成若干个相互联系的阶段,以便于求解,过程不同,阶段数就可能不同

  • 状态: 述事物的性质,不同事物有不同的性质,因而用不同的状态来刻画。对问题的求解状态的描述是分阶段的

  • 决策: 根据题意要求,对每个阶段所做出的某种选择性操作

  • 策略: 由每个阶段的决策组成的序列称为策略

  • 状态转移方程: 用数学公式描述与阶段相关的状态间的演变规律

能采用动态规划求解的问题的性质

  • 最优化原理:

    如果问题的最优解所包含的子问题的解也是最优的,就称该问题具有最优子结构,即满足最优化原理。

  • 无后效性:

    即某阶段状态一旦确定,就不受这个状态以后决策的影响。也就是说,某状态以后的过程不会影响以前的状态,只与当前状态有关。

  • 有重叠子问题:

    即子问题之间是不独立的,一个子问题在下一阶段决策中可能被多次使用到。(该性质并不是动态规划适用的必要条件,但是如果没有这条性质,动态规划算法同其他算法相比就不具备优势)

解题步骤

  • 拆分问题
  • 定义状态(并找出初状态)
  • 状态转移方程

一般的模型方法

  • 递归搜索法
  • 记忆化搜索(记忆化暴力)
  • 递推式法 

经典例题数塔问题

我们先来看一下数塔问题:

题目描述:

如图数字三角形。如下所示为一个数字三角形。请编一个程序计算从顶到底的某处的一条路径,使该路径所经过的数字总和最大。只要求输出总和。
 
1. 一步可沿左斜线向下或右斜线向下走;
2. 三角形行数小于等于 100;
3. 三角形中的数字为 0,1,…,99;

测试数据通过键盘逐行输入。

如上例数据应以样例所示格式输入:
输入:

5
7
3 8
8 1 0
2 7 4 4
4 5 2 6 5

输出:

30

题目分析:

解决该题目的方式有很多,包括动态规划, 枚举都可以解决这个问题。

我们从递推的思想出发,假设我们从顶层沿着某条路径已经走到了第 i 层,正向着 i+1 层前进, 两条可行路径中我们肯定会选择最大的方向前进,为此我们可以采用递推中的反向递推,即逆推的方式解决,设 a[i][j] 存放从 i,j 出发到达第 n 层的最大值。

我们可以写出递推式:

a[i][j] = max{a[i][j]+a[i+1][j],a[i][j]+a[i+1][j+1]}

则 逆推到出发点 a[1][1]a[1][1] 为题目所求答案,即第一层到第 N 层的最大值。

 解析:

在用动态规划考虑数塔问题时可以自顶向下的分析,自底向上的计算。

从顶点出发时到底向左走还是向右走应取决于是从左走能取到最大值还是从右走能取到最大值,只要左右两道路径上的最大值求出来了才能作出决策。

同样的道理下一层的走向又要取决于再下一层上的最大值是否已经求出才能决策。

这样一层一层推下去,直到倒数第二层时就非常明了。

所以第一步对第五层的 8 个数据,做如下四次决策:

  • 如果经过第四层 2,则在第五层的 4 和 5 中,决策选择的肯定是 19

  • 如果经过第四层 7,则在第五层的 5 和 2 中,决策选择的肯定是 10

  • 如果经过第四层第一个 4,则在第五层的 2 和 6 中,决策选择的肯定是 6

  • 如果经过第四层第二个 4,则在第五层的 6 和 5 中肯定是 6

经过一次决策,问题降了一阶。5 层数塔问题转换成 4 层数塔问题,经过如此的决策,就将原来问题转换为一阶数塔问题。

于是我们可以用我们上面的递推求解。

a = [[0] * 101] * 101

if __name__ == '__main__':

  n = int(input())

  # 输入数字三角形的值
  for i in range(1, n+1):
      a[i] = input().split()
      a[i] = list(map(int, a[i]))  # split 分割后都是 字符 这里是转化成数字
  #
  # for i in range(1, n + 1):
  #     print(a[i])

 # a = list(map(int, a)) # split 分割后都是 字符 这里是转化成数字

  # 递推开始

  for i in range(n - 1, 0, -1):
      # 最后一层逆推
      for j in range(0, i):

          # 路径选择
          if a[i + 1][j] >= a[i + 1][j + 1]:
              a[i][j] += a[i + 1][j]

          else:
              a[i][j] += a[i + 1][j + 1]

  # for i in range(1, n + 1):
  #     print(a[i])

  print(a[1][0])

附带一道在牛客网上做的一道真题:(加油加油)

描述

王强决定把年终奖用于购物,他把想买的物品分为两类:主件与附件,附件是从属于某个主件的,下表就是一些主件与附件的例子:

如果要买归类为附件的物品,必须先买该附件所属的主件,且每件物品只能购买一次。

每个主件可以有 0 个、 1 个或 2 个附件。附件不再有从属于自己的附件。

王强查到了每件物品的价格(都是 10 元的整数倍),而他只有 N 元的预算。除此之外,他给每件物品规定了一个重要度,用整数 1 5 表示。他希望在花费不超过 N 元的前提下,使自己的满意度达到最大。

满意度是指所购买的每件物品的价格与重要度的乘积的总和,假设设第ii件物品的价格为v[i]v[i],重要度为w[i]w[i],共选中了kk件物品,编号依次为j_1,j_2,...,j_kj1​,j2​,...,jk​,则满意度为:v[j_1]*w[j_1]+v[j_2]*w[j_2]+ … +v[j_k]*w[j_k]v[j1​]∗w[j1​]+v[j2​]∗w[j2​]+…+v[jk​]∗w[jk​]。(其中 * 为乘号)

请你帮助王强计算可获得的最大的满意度。

输入描述:

输入的第 1 行,为两个正整数N,m,用一个空格隔开:(其中 N ( N<32000 )表示总钱数, m (m <60 )为可购买的物品的个数。)从第 2 行到第 m+1 行,第 j 行给出了编号为 j-1 的物品的基本数据,每行有 3 个非负整数 v p q(其中 v 表示该物品的价格( v<10000 ), p 表示该物品的重要度( 1 5 ), q 表示该物品是主件还是附件。如果 q=0 ,表示该物品为主件,如果 q>0 ,表示该物品为附件, q 是所属主件的编号)

输出描述:

 输出一个正整数,为张强可以获得的最大的满意度。

 

代码:

firstInput = input()
money = int(firstInput.split(' ')[0])
count = int(firstInput.split(' ')[1])
# 用字典存储主件和附件
primary, annex = {}, {}
for i in range(1, count+1):
    # x 价格 y权重 z主组件id
    x, y, z = map(int, input().split(" "))
    if z==0:
        primary[i] = [x, y]
    else:
        if z in annex:
            annex[z].append([x, y])
        else:
            annex[z] = [[x, y]]
# 创建状态数组
dp = [0]*(money+1)
# 枚举所有情况
for key in primary:
    w, v = [], []
    # 添加主件
    w.append(primary[key][0])
    v.append(primary[key][0] * primary[key][1])
    # 主件存在附件
    if key in annex:
        w.append(w[0]+annex[key][0][0])
        v.append(v[0]+annex[key][0][0]*annex[key][0][1])
        # 存在两个附件
        if len(annex[key])>1:
            # 单独要附件2
            w.append(w[0]+annex[key][1][0])
            v.append(v[0]+annex[key][1][0]*annex[key][1][1])
            # 附件全要
            w.append(w[1]+annex[key][1][0])
            v.append(v[1]+annex[key][1][0]*annex[key][1][1])
    # 更新对应钱数能买的最大满意度
    for j in range(money, -1, -10):
        for k in range(len(w)):
            if j-w[k]>=0:
                dp[j] = max(dp[j], dp[j-w[k]] + v[k])
print(dp[money])

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

恁说叫啥就叫啥

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值