对动态规划问题的一些思考

最新推荐文章于 2024-01-25 22:21:36 发布

RobotX900

最新推荐文章于 2024-01-25 22:21:36 发布

阅读量2.3k

点赞数 7

分类专栏：编程算法文章标签：动态规划 dp hdoj 算法

本文链接：https://blog.csdn.net/foryoundsc/article/details/51974286

版权

编程算法专栏收录该内容

8 篇文章 0 订阅

订阅专栏

HDOJ刷了一些动态规划(DP)问题,做些总结.

1 序列

目前看来,所有的动态规划问题基本上都存在一个序列,序列中的元素可以按照某种顺序唯一地排序.更抽象地说,排序的方式通常是这些元素在某个事件发生过程的时间轴上的位置.

我们说”序列”而非”集合”,是因为元素的唯一排序方式是非常重要的.因为这样我们就可以将精力集中于组合而非排列.在我看来,动态规划问题在本质上是一种组合问题,这样的问题总是可以通过枚举序列元素的全部组合而得以解决.

问题中的序列有时很明显,有时不明显(2059),有时是二维的(2571),甚至干脆没有显示给出(2084).不管怎样,我认为解决动态规划问题的首要任务就是明确这个序列.序列明确以后,我们就可以直接”腰斩”这个问题并考虑其”下半身”,即直接从序列的第i个元素开始思考问题.

2 问题的表示

由于动态规划问题总是关联着一个序列,因此我们可以用序列表示这个问题.比如用[0:]表示原问题,用[i:]表示从问题的”下半身”.就像在物理中我们总是将物体抽象成一个质点一样,将动态规划问题抽象成一个序列对我们进一步思考问题有很大的帮助.

当然,没必要煞有介事地用上[i:]这个类似于切片的语法,直接用数字0表示原问题也未尝不可–这里的关键是内容,而非形式.我没有正式地对符号进行定义,因为接下来的讨论大多是描述性的,严格定义符号显得过分隆重.

另一方面,用[0:]这样的形式表述问题是不全面的,因为很多问题的完整描述需要额外的变量.比如对于完全背包问题,当序列是[0:]时,我们需要额外的一个变量w来表示背包的剩余容量.这样对问题的完整表述应该是([0:],w),或者随意一些,(0,w).w是必要的,(0,w)和(0,x)表示的是同一问题在两个不同状态下的解,或者干脆就是两个不同问题.

这样,对于一个问题,我们既可以将其表示成[i:]也可以表示成(i,j).尽管符号的使用非常随意,但是引入一些符号确实能帮助我们更方便地分析问题.下面是我在分析问题时使用的一些符号.

符号	意义
a[i]	序列的第i个元素
[i:]	从i号元素开始的序列,或者与这个序列相关的问题
(i)	思考问题[i:]时需要枚举的集合,或者第i个决策阶段,详见后面
(i,j), (i,j,k,…)	问题[i:]的另一种表述方式,此时我们强调表述问题的额外变量j,k等
t_i,j[x]	问题(i,j)在决策x下的局部最优解,详见后面
s[i,j]	问题(i,j)的解

无论如何,就像我刚才说的,这里重要的是内容而非形式.

3 找到序列

大多数情况下,找到问题的序列是容易的.事实上,我们几乎总是可以凭借直觉准确地找到决定问题的那个序列.在一些罕见的直觉失效的情况下,我们可以用下面这种方式来寻找这个序列.

第一种方式是将问题视为一个枚举问题,我们只要枚举某些元素就能够解决问题.在这种情况下,被枚举的元素构成这个序列.2059就是典型的这种问题,乌龟只要从所有的充电站中选择合适的若干个来充电,就能在最短的时间内跑到终点.因此,它只要枚举所有的选择方案就能解决这个问题.被枚举的对象是充电站的组合,那么充电站的序列自然而然的成为了与这个问题关联的序列.

第二种方式是将问题视为一个分阶段的决策问题,每个阶段都关联着问题中的一个元素,此时,所有阶段的所有元素构成与这个问题相关的序列.完全背包问题是一个典型的决策类动态规划问题.在第i个阶段,我要选择j个i号物品,然后进入第i+1个阶段,进行i+1号物品的选择.这样物品的编号就是与这个动态规划问题关联的序列.

事实上,我们将会看到,将动态规划问题视为枚举或决策问题的思想对于解决整个动态规划问题都十分有效,我们仅仅使用这种思想来寻找问题的序列有点”杀鸡用牛刀”的感觉.

无论如何,现在我们拥有一个序列了.接下来我们要面临真正的考验,即解决问题[i:].正如我刚才所说,思考这个问题的切入点正是将问题视为一个枚举或决策问题.

4 枚举问题

有些问题可以被非常自然地理解为一个枚举问题.此时,我们将为了解决问题[0:]而需要枚举的集合记为(0),这样我们的从集合(i)开始思考问题.有两种思考问题的方式.不管采用哪种方式,我们的目的都是为了用集合(i+1)将集合(i)表示出来.

第一种方式是直接用序列中的元素将集合(i)表示出来,然后重复同样的步骤以得到集合(i+1).接下来,只要观察这两个集合,就可以找到它们的关系.1003是典型的这种问题.

第二种方式采用了归纳法的思想.在这种情况下,假设对于所有的整数x>0,集合(i+x)已知,然后我们想方设法用(i+x)将(i)表示出来.

无论用那种方式,最终我们会得到(i)和(i+x)的表达式.通常是下面这个样子:

(i) = AUBUC…

其中A,B,C是由(i+x)导出的集合.

这样,我们就可以通过考察(i)和(i+x)的关系来找到s[i]和s[i+x]的关系.当然,s[i]和s[i+x]并不是总是存在关系,甚至,(i)并非总是能够用(i+x)表示.但是对于动态规划问题,我们有充分的理由来保持乐观的态度.

5 分阶段决策问题

另一些问题很容易被视为一个分阶段决策问题,典型的如完全背包问题,以及1176,2084,2571等.这个时候我们对[i:]的思考非常直接.

从阶段(i)开始,我们做出一个决策x,然后进入阶段(i+1),即问题[i:]在决策x下变成了问题[i+1:].这个时候,我们使用强调全部变量的方式来表述问题,因此这个变化可以记为:

(i,j) -x-> (i+1, j^*)

观察这个变化,我们就可以进一步找出t_i,j[x]与s[i+1,j^*]的关系,通常可以表示成下列形式:

t_i,j[x] = f(a[i], s[i+1, j^*])

问题(i,j)的解可以通过考察所有的t_i,j[x]得到:

s[i,j] = g(t_i,j[x₁], t_i,j[x₂],…)

注意,做出决策x未必一定会跳转到阶段(i+1),比如跳棋问题,以及1260等.只不过,无论跳转到(i+1)还是(i+n),思考问题的方式是一样的,而(i+1)是普遍情况并且更容易表示和理解,因此我使用(i+1)而非更一般的(i+x).

6 补充说明

关于枚举和决策问题,有必要做出以下两点补充:

第一,枚举问题和分阶段决策问题的界线是模糊的.我们既可以强行以枚举的方式解决决策问题,也可以强行以决策的方式解决枚举问题.只是,将有的问题视为枚举问题确实比把它视为决策问题要自然一些,反之也是如此.

第二,解决决策问题比解决枚举问题要容易地多.事实上,当找到集合(i)和(i+x)的关系以后,接下来将集合结构向决策结构靠拢是一个十分有效的思路.

7 什么样的问题不是动态规划问题

似乎我们有一些手段可以判定一个问题不是动态规划问题,至少,下面这两类问题看上去很难归结为动态规划问题:

不能用枚举的方式解决的问题,例如1209和1257;
要枚举所有排列才能解决的问题.如2544和1789.

特别地,考虑到动态规划问题是一些组合问题,即这类问题的本质是从整体中选择若干个元素.因此如果问题的解一定由全部元素构成(比如问题的解是全部元素的某个排列),那么这类问题不太可能是一个DP问题.

虽然2544作为最短路径问题确实有动态规划解法,但是我倾向于将这个问题划归为非DP问题,原因如下:

2544的DP解法在本质上与dijkstra算法是一样的,而dijkstra算法通常被视为贪心算法;
2544不具备动态规划问题的一些常见特征,如序列特征(你无法将图中的节点排成一个唯一序列),组合特征(相同节点的不同排列构成不同的路径).

其次,如果如果全排列的个数比较少(通常少于16!),那么第二类问题有时候可以用动态规划来解,事实上这是动态规划问题的一大子类,叫做状态压缩动态规划.

8 不足之处

上述讨论只是非常粗略,抽象,浅显地讨论了解决动态规划问题的一些思考方式.算是对上述28个问题的一些高度很底的总结.但是这些总结的直接作用是非常有限的.事实上,上述总结甚至不能指导你完整地解决完全背包问题和状态压缩问题.

不仅如此,有很大一部分动态规划问题具有巨大的特殊性,以至于它们几乎完全与上述总结格格不入.如最长公共子序列问题(1159).

而另一部分动态规划问题虽然可以纳入上述思路,但是其最优子结构或者重复子问题是如此难以寻找,以至于我们即使完全照搬上述思路也依然还是会陷入束手无策的境地,例如1421,这是一个最优子结构很难寻找的问题.更进一步,如果不是已经被模型化了,那么01背包问题和完全被背包问题完全可以成为重复子问题难以寻找的典型.

9 后记

正如我刚才所说,每个动态规划问题都有其特殊性,或者很难找到最优子结构,或者很难找到重复子问题.我想,也许只有数学家才能给出一种简洁优雅的表示方法,但那必是极度抽象的.而理论越抽象往往越难应用到实际.所以我从不奢求能对动态规划问题总结出一种”大统一”的东西.

上面这些所谓的”总结”,一非正式,二非全面,三非高人之笔,对一些人而言,说是毫无价值也不为过.但是我的初衷仅仅是希望将来自己看到这篇文章时,能很快回忆起我此时此刻对动态规划的理解.当然,如果居然有人能够”不厌其烦”地读完,并由此而产生一些自己的想法,那我简直要荣幸至极了.

10 附录

10.1 统计

DP	非DP	补充	合计
23	4	1	27

10.2 题表

动态规划

#	分类	遍历对象	遍历方式	模型	特点
1003	决策	连续子序列	特有的决策方式	最大连续子序列和问题
1024
1069	枚举	有序子序列	跳转	跳棋问题
1074	决策	排列	有状态DFS
1087	枚举	有序子序列	跳转	跳棋问题
1114	决策	数量组合	乘法原理	完全背包问题
1159	特殊	子序列	特殊	最长公共子序列问题
1160	枚举	有序子序列	特转	跳棋问题
1171	决策	数量组合	乘法原理	完全背包问题
1176	决策	组合3	无状态DFS
1203	决策	基本组合	无状态DFS	01背包问题
1231	决策	连续子序列	特有的决策方式	最大连续子序列和问题
1260	决策	基本组合	无状态DFS
1284	决策	数量组合	乘法原理	完全背包问题
1421
1978	决策	有序子序列	跳转		二维问题
2059	决策	基本组合	无状态DFS
2084	决策	基本组合	无状态DFS
2159	决策	数量组合	无状态DFS	完全背包问题	多限制,三维
2191	决策	数量组合	无状态DFS	完全背包问题
2571	决策	有序子序列	跳转
2602	决策	基本组合	无状态DFS	01背包问题	教科书式背包问题
2709	决策	数量组合	无状态DFS	完全背包问题