动态规划之最长公共子序列问题 C++实现

最新推荐文章于 2022-02-05 06:35:48 发布

_MICHAEL_LIU_

最新推荐文章于 2022-02-05 06:35:48 发布

阅读量4.8k

点赞数 1

分类专栏： C++、算法与数据结构文章标签： C++ 动态规划算法

本文链接：https://blog.csdn.net/liu798675179/article/details/53080614

版权

C++、算法与数据结构专栏收录该内容

33 篇文章 3 订阅

订阅专栏

动态规划之最长公共子序列问题 C++实现

原理

在之前的文章当中，作者论述了什么是动态规划，这次，我们来看看，如何用动态规划解决最长公共子序列问题。

这个问题经常运用在判断两种生物的相似度----DNA比对上。对比俩串的方式有很多种，例如如果一个串是另一个的字串，那么可以说两个串是相似的：如果将一个串转换为另一个串的操作很少，那么也可以说这两个串是相似的。另一种衡量俩串 $S_1,S_2$ 的相似度方式为：寻找第3个串 $S_3$ ，它的所有元素也都出现在 $S_1$ 和 $S_2$ 中，且在三个串中出现的顺序都相同，但在 $S_1,S_2$ 中不要求连续出现。我们将最后一种相似的概念描命名最长公共子序列问题。

其形式化定义如下：给定一个序列 $X=\left\langle x_1,x_2\dots,x_m\right\rangle$ ，另一个序列 $Y=\left\langle y_1,y_2,\dots,y_k\right\rangle$ 满足如下条件时成为 $X$ 的子序列（sunsequence），即存在一严格递增的 $X$ 的下标序列 $\left\langle i_1,i_2,\dots,i_k\right\rangle$ ，对所有 $j=1,2,\dots,k$ 满足 $_{i_j}=z_j$ 。例如， $Z=\left\langle B,C,D,B\right\rangle$ 是 $X=\left\langle A,B,C,B,D,A,B\right\rangle$ 的子序列，对应的下标为 $\left\langle 2,3,5,7\right\rangle$ 。
给定一个序列 $X=\left\langle x_1,x_2\dots,x_m\right\rangle$ ，对 $i=1,2,\dots,k$ ，定义 $X$ 的第 $i$ 前缀为 $X_i=\left\langle x_1,x_2\dots,x_i\right\rangle$ 。

刻画最长公共子序列的特征

$L C S$ 的最优子结构：令 $X=\left\langle x_1,x_2\dots,x_m\right\rangle$ 和 $Y=\left\langle y_1,y_2,\dots,y_n\right\rangle$ 为两个序列， $Z=\left\langle z_1,z_2,\dots,z_k\right\rangle$ 为 $X$ 和 $Y$ 的任意 $L C S$ 。
1.如果 $x_m=y_n$ ，则 $z_k=x_m=y_n$ 且 $Z_{k-1}$ 是 $X_{m-1}$ 和 $Y_{n-1}$ 的一个 $L C S$ 。
2.如果 $x_m\neq y_n$ ，则 $z_k\neq x_m$ 且 $Z$ 是 $X_{m-1}$ 和 $Y$ 的一个 $L C S$ 。
3.如果 $x_m\neq y_n$ ，则 $z_k\neq y_n$ 且 $Z$ 是 $X$ 和 $Y_{n-1}$ 的一个 $L C S$ 。

一个递归解

我们定义 $c [i, j]$ 表示 $X_i$ 和 $Y_j$ 的 $L C S$ 的长度。则根据 $L C S$ 问题的最优子结构性质，可得如下公式：
$c[i,j]=\left\{\begin{matrix} 0&if\ i=0\ or\ j=0 \\ c[i-1,j-1]+1&if\ i,j>0\ and\ x_i=y_j \\ max(c[i,j-1],c[i-1,j])&if\ i,j>0\ and\ x_i\neq\ y_j \end{matrix}\right.$

源代码

#include <iostream>
#include <utility>
#include <vector>
#include <string>

using namespace  std;

//ACCGTCGAGTGCGCGGAAGCCGGCCGAA & CTCGTTCGGAATGCCGTTGCTCTGTAAA
string temp_strX = { "#ACCGTCGAGTGCGCGGAAGCCGGCCGAA" }, temp_strY = { "#CTCGTTCGGAATGCCGTTGCTCTGTAAA" }; 

//Memoized of Lcs
pair<vector<vector<int>>,vector<vector<int>>> Lcs_Length(const string &temp_strX, const string &strY) {
	auto temp_m = temp_strX.size() - 1, temp_n = temp_strY.size() - 1;
	vector<vector<int>> temp_VecB, temp_VecC;

	temp_VecB.resize(temp_m + 1);
	temp_VecC.resize(temp_m + 1);

	for(auto &i : temp_VecB) {
		i.resize(temp_n + 1);
	}
	for(auto &i : temp_VecC) {
		i.resize(temp_n + 1);
	}

	for(auto i = 1; i <= temp_m; ++i) {
		temp_VecC[i][0] = 0;
	}
	for(auto j = 0; j <= temp_n; ++j) {
		temp_VecC[0][j] = 0;
	}

	for(auto i = 1; i <= temp_m; ++i) {
		for(auto j = 1; j <= temp_n; ++j) {
			if(temp_strX[i] == temp_strY[j]) {
				temp_VecC[i][j] = temp_VecC[i - 1][j - 1] + 1;
				temp_VecB[i][j] = -1;
			}
			else if(temp_VecC[i - 1][j] >= temp_VecC[i][j - 1]) {
				temp_VecC[i][j] = temp_VecC[i - 1][j];
				temp_VecB[i][j] = -2;
			}
			else {
				temp_VecC[i][j] = temp_VecC[i][j - 1];
				temp_VecB[i][j] = -3;
			}
		}
	}

	return make_pair(temp_VecC, temp_VecB);
}

//Print
void Print_Lcs(const vector<vector<int>> & temp_VecB, const string &temp_strX, const size_t &i, const size_t &j) {
	if(i == 0 || j == 0) {
		return;
	}

	if(temp_VecB[i][j] == -1) {
		Print_Lcs(temp_VecB, temp_strX, i - 1, j - 1);
		cout << temp_strX[i];
	}
	else if(temp_VecB[i][j] == -2) {
		Print_Lcs(temp_VecB, temp_strX, i - 1, j);
	}
	else {
		Print_Lcs(temp_VecB, temp_strX, i, j - 1);
	}
}

int main() {
	auto temp_pair = Lcs_Length(temp_strX, temp_strY);
	Print_Lcs(temp_pair.second, temp_strX, temp_strX.size() - 1, temp_strY.size() - 1);

	return 0;
}

_MICHAEL_LIU_

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
动态规划之最长公共子序列问题 C++实现

动态规划之最长公共子序列问题 C++实现原理在之前的文章当中，作者论述了设么事动态规划，这次，我们来看看，如何用动态规划解决最长公共子序列问题。这个问题经常运用在判断两种生物的相似度—-DNA比对上。对比俩串的方式有很多种，例如如果一个串是另一个的字串，那么可以说两个串是相似的：如果将一个串转换为另一个串的操作很少，那么也可以说这两个串是相似的。另一种衡量俩串S1,S2S_1,S_2的相似度方式为：
复制链接

扫一扫