6.动态规划背包问题最短路径区间调度 bellmanford

最新推荐文章于 2023-11-28 21:01:33 发布

anditty

最新推荐文章于 2023-11-28 21:01:33 发布

阅读量939

点赞数

文章标签：算法算法导论动态规划 bellman–ford algorithm

本文链接：https://blog.csdn.net/qq_43210583/article/details/108325767

版权

文章目录

动态规划

动态规划

一、带权的区间调度问题

现在所有的区间都带上了一个权。我们要做的也不仅仅是选择最多相容的区间，而是选择最大权组合的区间（即原来所有的权都是1）。关于这个问题的解法到目前还没有一个贪心算法可以解决。我们采用的是贪心算法。下面将介绍这种算法。

我们先将这些区间按照结束时间从小到大的顺序排序。然后令OPT（j）表示区间1-j之中的最优解，p（j）表示在需求j的前一个不和j冲突的需求，vj表示j的权。那我们有以下结论

OPT（j）=max（vj+OPT（P（j）），OPT（j-1））

我们立马就得到了算法的伪代码：

OPT（j）

if j=0

return 0

else

return max（vj+OPT（P（j）），OPT（j-1））

正确性证明可以由归纳法得出。

但是这个问题的复杂度会相当的大，因为每个问题都会分出两个子问题，每个子问题又会分出两个子问题，我们的时间复杂度是指数级的，那么有没有一种方法能够降低到多项式级别呢？

观察可知，对于每个OPT（i）其实我们都只用计算一次即可。所以我们可以保存下来他们的值。我们在伪代码的实现中只需要加上对数组是否存在的判断即可。

这个新的算法复杂度应该是递归被调用的次数，但是我们并不能很好的知道这一点，但是我们发现每次都会算出一个OPT（？）的值，因此总的复杂度就是O（n）

好，现在我们获得了最优解的值，但是如果我们想要知道具体的最优解该怎么办呢？因为我们已经把OPT（）的每个值都已经存在某个数组M中了，我们想要知道某个需求有没有被选择，只需要看vj+OPT（P（j））≥OPT（j-1）有没有被满足不就可以了吗？因此我们设计了另个单独的递归方法实现这一点。

Find(j)
  if j=0
    不输出
  else
    if vj+M[P(j)]≥M[j-1]
      输出j和Find(P(j))
    else
      输出Find(j-1)

可以看出这个算法的复杂度也是O（n）

二、子集和背包问题（加了一个变量）

问题是你有1-n个物品要放入背包，每个物品有不同的价值vi和重量wi，要求是你所放的所有的物品重量要小于某个值w的同时达到w最大。同样，令OPT（j）表示从1-j上的最优解。

我们先给出状态方程：

OPT(j,w)=max(OPT(j-1,w), OPT(j-1,w-wj)+wj)

可以观察到OPT的变量多了一个，这也是由于我们的限定条件多了一个所造成的。

下面给出伪代码：

bag(j,w)
	create M[n][w]
	let M[0][0...w]=0
	for j=1,2,3...n
		for w=0,1,2...w
			M[j][w]=max(M[j-1][w],M[j-1][w-wj]+wj)
		end
	end
	return M

显然，这个算法的复杂度是O（nW）

三、RNA的结构问题

对于一个RNA我们通常说他满足以下几个条件：

不能弯转的太尖，即两个碱基对之间至少有四个碱基分隔
所有碱基对都由（A，U）（C，G）组成
没有碱基出现在一个以上的pair中
不交叉

假设OPT（i，j）表示碱基i到j之间能产生的最多pair的数量，我们有：

OPT(i,j)=max(OPT(j-1),max_t(1+OPT(i,t-1)+OPT(t+1,j-1)))

这个式子表示要么j不和任何碱基匹配：OPT(j-1)

要么j和某个碱基t匹配，由于不交叉原理，剩余的匹配只能产生在i到t-1和t+1到j-1之中，所以数量是max（1+OPT(i,t-1)+OPT(t+1,j-1)）这里的max表示遍历所以可能的t得到的结果。

*接下来要实现这个算法我们要做一件很重要的事情，就是考虑这个算法增长的顺序，可以发现我们每次都是在更小的区间里去选择最优解，且我们已知最小区间里的值（初始化的内容），因此我们得到了伪代码：

初始化：若i-j≤4，则OPT（i，j）=0
for k=5,6,7...n-1
	for i=1,2,3...n-k
		j=i+k
		OPT(i,j)=max(OPT(j-1),max~t~(1+OPT(i,t-1)+OPT(t+1,j-1)))

时间复杂度分析：因为总共有n²个子问题要求解，且每次问题都要遍历得到最优的t，所以总的时间复杂度是O（n²）

四、序列比对

这个问题一般可以用于探究两串数列或两个单词M，N的相似性。怎么去衡量相似性？这里我们定义两个参数a，b。a表示错配代价，若M和N中相同位置的字母配对，则没有发生错配，那么错配代价是0。我们再定义一个空配代价b，表示b没有跟任何字母配对时的代价。我们选取两个代价和最小的配对方式作为我们的最优解。

假设用m，n表示当前M，N最后的字母。那么对于m，n一定存在以下三种情况之一：

m，n配对
·m不发生配对
n不发生配对

一定不存在m，n都和另外某两个字母配对的情况，因为这样一定会发生交叉配对的情况，这种情况在我们目前的要求下时不存在的。

那我们可以写出动态规划关系式(令OPT（i，j）)表示在1……i和1……j两串字符串匹配中的最小代价）：

OPT(i，j)=min(OPT(i-1,j-1)+a_ij, OPT(i,j-1)+b,OPT(i-1,j)+b)

算法复杂度是O（mn）

但是算法存在一个缺陷，就是其空间复杂度也是巨大的—O（mn），这对于一些很长的序列，比如DNA序列，开销无疑是巨大的，接下来将介绍一种减少这个开销的技术。·

五、利用分治策略减少序列对比的空间开销

我们首先很容易想象到的方法是折叠这个数组，在极限情况下甚至能够折叠到2*2的空间复杂度，因为我们发现我们每次都是在用i或着i-1行的数据，也是在用j或j-1列的数据，因此如果我们让数据覆盖以前的数据，我们就只要两行或两列就能完成这个算法了。

但是问题来了，由于我们只能保存2*2=4个数据，我们根本无法复原从而得到在最优解下两个数列比对的方式。因此我们引入了以下的方法。

首先我们并不压缩到这么极致的情况，我们只把空间压缩到O（m）的大小，即我们知道在最后一行（第n行），各个OPT（i，n）的结果，我们保存了一行的结果。

然后我们创造一个逆向的这样的算法，我们不再用OPT（i，j）表示（0，0）到（i，j）的最优解，而是用他表示（i，j）到m，n的最优解。我们只需要略微改动状态方程即可：

OPT(i，j)=max(OPT(i+1,j+1)+a_i+1,j+1, OPT(i+1,j)+b,OPT(i,j+1)+b)

接着我们用一种新式的方式表示这个问题，我们用一个图来表示，横着走的花费是空位，斜着走的花费是错位，这样两点之间的最短距离就是最优解：

然后我们将这个正向和逆向的算法相结合，令f（i，j）表示正向算法的结果，即（0，0）到（i，j），用g（i，j）表示逆向的结果。那么有：f（i，j）+g（i，j）就是整个的最优解。那么假设i不确定，j确定，那么必定存在某个i使得f（i，j）+g（i，j）达到最小值，且这个点（i，j）必定是结果中路径上的一个点。这样我们结合两个算法之后，就能确认某一列上的某个点在结果之中。

然后我们用分治的方式，每次都去确认第n/2列上最优解对应的点，从而达到收集所有的点的目的。

算法的伪代码给出：

declare list L
DCA(X,Y)
 let m be the number of words in X
 let n be the number of words in Y
 if m or n ≤2
  just computer it
 else
 	正向计算X，Y[1:n/2]
 	逆向计算X，Y[n/2+1:n]
 	let q be the index of min(f(q,n/2)+g(q,n/2))
 	put (q,n/2) into a list L
 	DCA(X[1:q],Y[1:n/2])
 	DCA(X[q:n],Y[n/2:n])

空间复杂度分析，通过这个递归的执行项目的位置可以看到我们执行是在递的过程而不是归的过程，我们每次只执行一层递归操作，所用的空间最多就是O（m+n），在进行下一次递归的时候这些空间就会被释放。因此我们的复杂度是O（m+n）。

算法的时间复杂度分析，假设我们每次q都是一次完美的平均分隔，且m=n，那么我们的复杂度可以这样写T（n）=2T（n/2）+n²=n²。即O（mn）因此我们做到了在复杂度不变的情况下减少了空间复杂度，且能通过list L追踪到结果。

当然这个时间复杂度的证明是在完美情况下的证明，对于更一般的情况，我们可以使用归纳法。

proof：我们假设T（m’，n’）≤km’n’对于较小的m’和n’成立。那么对于T（m，n）≤cmn+T（q，n/2）+T（m-q，n/2）≤cmn+kqn/2+k（m-q）n/2=（c+k/2）mn