最长公共子串(Longest common substring)问题指的是求出给定的一组字符串的长度最大的共有的子字符串。
举例说明,以下三个字符串的LCS就是 cde: (字符可以不相邻)
asdf
awsrdef
asdff
这个算法很经典,就不解释了,不清楚的google一下吧,写日志就是为了记录下来。
先给出原始版:(函数返回所求的lcs,字符串和二维数组在全局定义)
int lcs[MAXSIZE][MAXSIZE];
char s1[MAXSIZE],s2[MAXSIZE];
int LCS()
{
int i,j,len1,len2;
len1 = strlen(s1);
len2 = strlen(s2);
for(i=0;i<=len1;i++)lcs[i][0] = 0;
for(i=0;i<=len2;i++)lcs[0][i] = 0;
for(i=1;i<=len1;i++)
for(j=1;j<=len2;j++)
{
if(s1[i-1] == s2[j-1])
lcs[i][j] = lcs[i-1][j-1] + 1;
else
lcs[i][j] = max(lcs[i-1][j],lcs[i][j-1]);
}
return lcs[len1][len2];
}
空间上优化:
在每次计算中,我们只需要二维数组c中的两行,即当前行lcs[ i ][ 0...strlen(s2) ]和上一行lcs[ i-1 ][ 0...strlen(s2) ],(因为当前位置的值只与左,上,左上位置的值有关),因此一共只需要一个2*strlen(s1)或者2*strlen(s2)的数组就能计算出LCS(两行反复使用),下面给出代码:(用的是2*strlen(s2)大小的数组)
int lcs[2][MAXSIZE];
char s1[MAXSIZE],s2[MAXSIZE];
int LCS()
{
int i,j,len1,len2;
int tag=1;
len1 = strlen(s1);
len2 = strlen(s2);
memset(lcs[0],0,len2*sizeof(int));
lcs[1][0] = 0;
for(i=1;i<=len1;i++)
{
for(j=1;j<=len2;j++)
{
if(s1[i-1] == s2[j-1])
lcs[tag][j] = lcs[1-tag][j-1] + 1;
else
lcs[tag][j] = max(lcs[1-tag][j],lcs[tag][j-1]);
}
tag = 1 - tag;
}
return lcs[1-tag][len2];
}