问题:
求字符串的最长公共子串。
(这里注意子序列和子串的区别,子序列可以是从原字符串中取出一部分元素重新拼接而成的字符串,但取出的元素之间的前后关系要与原字符串一致;而子串则必须是连续的。如”adf”是”abcdef”的子序列,而不是子串。)
分析与解法:
使用动态规划来求解。采用一个二维矩阵来记录中间的结果。以”bab”和”caba”(当然现在一眼就可以看出来最长公共子串是”ba”或”ab”)为例。
当数组中对应位置的字符相等时,则填1。
看矩阵的斜对角线最长的那个就能找出最长公共子串。
不过在二维矩阵上找最长的由1组成的斜对角线也是件麻烦费时的事,下面改进:当要在矩阵是填1时让它等于其左上角元素加1。
于是二维数组中的最大元素就是最长公共子串的长度。
设二维数组为c[][],两个字符串为x0,…,xi,y0,…,yj,
- xi == yj,则c[i][j] = c[i-1][j-1]+1;
- xi != yj,则c[i][j] = 0。
最长公共子串的长度即为,max{c[i][j], 1<=i<=n,1<=j<=m}。
代码如下,
#include<iostream>
#define MAXSIZE 20
using namespace std;
/*求最长公共子串*/
void LCS(char *x, char *y, int x_len, int y_len, int &max, int &mi, int &mj)
{
int c[MAXSIZE][MAXSIZE];
int i, j, k;
for(i = 0; i <= x_len; i++)//注意i,j的取值范围
c[i][0] = 0;
for(j = 0; j <= y_len; j++)
c[0][j] = 0;//第0行,第0列都初始化为0
for(i = 1; i <= x_len; i++)
{
for(j = 1; j <= y_len; j++)
{
if(x[i - 1] == y[j - 1])
c[i][j] = c[i - 1][j - 1] + 1;
else
c[i][j] = 0;
if(max < c[i][j])
{
max = c[i][j];
mi = i;
mj = j;//记录数组中最大值的坐标
}
}
}
}
/*输出最长公共子串*/
void showLCS(char *x, char *y, int x_len, int y_len, int max, int mi, int mj)
{
char lcs[MAXSIZE];
int k = max;
int i = mi - 1, j = mj - 1;//数组中最大值在字符串中的下标
lcs[k--] = '\0';
while(i >= 0 && j>= 0)
{
if(x[i] == y[j])
{
lcs[k--] = x[i];
i--;
j--;
}
else
break;//出现不等的情况,说明公共字符串不连续
}
cout << lcs << endl;
}
int main(void)
{
char x[MAXSIZE], y[MAXSIZE];
int x_len, y_len;
cin >> x_len >> y_len;
for(int i = 0; i < x_len; i++)
cin >> x[i];
for(int j = 0; j < y_len; j++)
cin >> y[j];
int max, mi, mj;//最大公共子串的长度及坐标
LCS(x, y, x_len, y_len, max, mi, mj);
showLCS(x, y, x_len, y_len, max, mi, mj);
return 0;
}
时间复杂度为O(mn)。
文章参考以下博文:
http://blog.csdn.net/hackbuteer1/article/details/6686931
http://my.oschina.net/leejun2005/blog/117167