求两个字符串的最长公共子串(LCS)

最长公共子串(LCS),有三种情况:1.公共子串的元素必须相邻. 2.公共子串的元素可以不相邻联单3. 求多个字符串而不是两个字符串的最长公共子串

1.公共子串的元素必须相邻:

    LCS问题就是求两个字符串最长公共子串的问题。解法就是用一个矩阵来记录两个字符中所有位置的两个字符之间的匹配情况,若是匹配则为1,否则为0。然后求出对角线最长的1序列,其对应的位置就是最长匹配子串的位置.

下面是字符21232523311324和字符312123223445的匹配矩阵,前者为X方向的,后者为Y方向的。不难找到,红色部分是最长的匹配子串。通过查找位置我们得到最长的匹配子串为:21232
          0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
    0 1 0 0 0 0 0 0 0 1 1 0 0 0 0
    1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
    0 1 0 0 0 0 0 0 0 1 1 0 0 0 0
    1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
    0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
    1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
    1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
    0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
    0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
    0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
    0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
    0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
    但是在0和1的矩阵中找最长的1对角线序列又要花去一定的时间。通过改进矩阵的生成方式和设置标记变量,可以省去这部分时间。下面是新的矩阵生成方式:

          0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
    0 1 0 0 0 0 0 0 0 2 1 0 0 0 0
    1 0 2 0 1 0 1 0 0 0 0 0 1 0 0
    0 2 0 0 0 0 0 0 0 1 1 0 0 0 0
    1 0 3 0 1 0 1 0 0 0 0 0 1 0 0
    0 0 0 4 0 0 0 2 1 0 0 1 0 0 0
    1 0 1 0 5 0 1 0 0 0 0 0 2 0 0
    1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
    0 0 0 2 0 0 0 2 1 0 0 1 0 0 0
    0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
    0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
    0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
    0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
    当字符匹配的时候,我们并不是简单的给相应元素赋上1,而是赋上其左上角元素的值加一。我们用两个标记变量来标记矩阵中值最大的元素的位置,在矩阵生成的过程中来判断当前生成的元素的值是不是最大的,据此来改变标记变量的值,那么到矩阵完成的时候,最长匹配子串的位置和长度就已经出来了。

 

算法的基本思想

当字符匹配的时候,不是简单的给相应元素赋上1,而是赋上其左上角元素的值加一。

我们用两个标记变量来标记矩阵中值最大的元素的位置,在矩阵生成的过程中来判断

当前生成的元素的值是不是最大的,据此来改变标记变量的值,那么到矩阵完成的时

候,最长匹配子串的位置和长度就已经出来了。

#include<stdio.h>
#include<string.h>
#define N 100
 
//LCS问题就是求两个字符串最长公共子串的问题 
char *LCS(char *a,char *b) 
{
	int len_a = strlen(a);  //获取字串的长度 
	int len_b = strlen(b);
	char *p;
	int c[N][N] = {0};      //矩阵c记录两串的匹配情况 
	int start,end,len,i,j;  //start表明最长公共子串的起始点,end表明最长公共子串的终止点 
	end = len = 0;          //len表明最长公共子串的长度 
	for(i=0;i<len_a;i++)    //串开始从前向后比较 
	{
		for(j=0;j<len_b;j++)
		{			
			if(a[i] == b[j])
				if(i == 0 || j == 0)
					c[i][j] = 1;
				else
					c[i][j] = c[i-1][j-1] + 1;
		//	else
		//		c[i][j] = 0;
			if(c[i][j] > len)
			{
				len = c[i][j];	
				end = j;
			}	
		}
	}
	start = end - len + 1;
	p = (char *)malloc(len+1); //数组p记录最长公共子串 
	for(i=start;i<=end;i++)
		p[i-start] = b[i];
	p[len] = '\0';
	for(j=0;j<len_b;j++)
	{
		for(i=0;i<len_a;i++)
			printf("%2d",c[i][j]); 
		printf("\n");
	}
	return p;		
}
int main(int argc,char *argv[])
{
	char str1[N],str2[N];
	printf("请输入字符串1:");
	gets(str1);
	printf("请输入字符串2:");
	gets(str2);
	printf("最长子串为:%s\n",LCS(str1,str2));
	return 0;
}



注意:该算法只能打印出最长公共子串的一个,而不是全部解。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值