下面的程序分别实现了使用LCS求连续子串和不连续子串的匹配情况!
//查找两个字符串中的最长公共子串
//例如:abcdef 和 bdf 最长公共子串长度是3
//f(n,m)=f(n-1,m-1)+1 如果两个字符串的第一个字母相等
// =max(f(n-1,m),f(n,m-1)) 如果两个字符串的第一个字母不相等
//递归最后的条件是f(n,0)=f(0,m)=0
//不要求匹配的子串是连续的子串
#include<iostream>
#include<cstring>
#include<stdlib.h>
using namespace std;
int main()
{
char stra[20],strb[20];
cin>>stra>>strb;
int lengtha=strlen(stra);
int lengthb=strlen(strb);
int lcs_len(char *stra,int bega,int enda,char *strb,int begb,int endb); //使用数组下表来代表n和m
cout<<lcs_len(stra,0,lengtha-1,strb,0,lengthb-1)<<endl;
system("pause");
return 0;
}
int lcs_len(char *stra,int bega,int enda,char *strb,int begb,int endb)
{
if(bega>enda||begb>endb) //此处的条件不可写成bega>=enda||begb>=endb
return 0;
if(stra[bega]==strb[begb])
return lcs_len(stra,bega+1,enda,strb,begb+1,endb)+1;
else
{
if((lcs_len(stra,bega,enda,strb,begb+1,endb))>(lcs_len(stra,bega+1,enda,strb,begb,endb)))
return lcs_len(stra,bega,enda,strb,begb+1,endb);
else
return lcs_len(stra,bega+1,enda,strb,begb,endb);
}
}
//非递归算法
//矩阵运算,if(a[i]==b[j])
// c[i][j]=c[i-1][j-1]+1; 左上角的值+1
// else
// c[i][j]=((c[i-1][j]>c[i][j-1])?c[i-1][j]:c[i][j-1]); 上下的最大值
#include<iostream>
#include<cstring>
using namespace std;
#define M 1000
char c[M][M];
char a[M];
char b[M];
int my_lcs(char a[],char b[]){
int i,j;
int m=strlen(a);
int n=strlen(b);
for(i=0;i<m;++i){
for(j=0;j<n;++j){
if(a[i]==b[j])
c[i][j]=c[i-1][j-1]+1;
else
c[i][j]=((c[i-1][j]>c[i][j-1])?c[i-1][j]:c[i][j-1]);
}
}
int maxnum=-32768;
for(i=0;i<m;++i)
for(j=0;j<n;++j)
if(c[i][j]>maxnum)
maxnum=c[i][j];
return maxnum;
}
int main(){
cin>>a>>b;
cout<<my_lcs(a,b)<<endl;
return 0;
}
//匹配的子串是连续的子串
//非递归方法
/*
解法就是用一个矩阵来记录两个字符串中所有位置的两个字符之间的匹配情况,若是匹配则为1,否则为0。
然后求出对角线最长的1序列,其对应的位置就是最长匹配子串的位置.
下面是字符串21232523311324和字符串312123223445的匹配矩阵,前者为X方向的,后者为Y方向的。
不难找到,红色部分是最长的匹配子串。通过查找位置我们得到最长的匹配子串为:21232
0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
0 1 0 0 0 0 0 0 0 1 1 0 0 0 0
1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
0 1 0 0 0 0 0 0 0 1 1 0 0 0 0
1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
但是在0和1的矩阵中找最长的1对角线序列又要花去一定的时间。通过改进矩阵的生成方式和设置标记变量,
可以省去这部分时间。下面是新的矩阵生成方式:
0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
0 1 0 0 0 0 0 0 0 2 1 0 0 0 0
1 0 2 0 1 0 1 0 0 0 0 0 1 0 0
0 2 0 0 0 0 0 0 0 1 1 0 0 0 0
1 0 3 0 1 0 1 0 0 0 0 0 1 0 0
0 0 0 4 0 0 0 2 1 0 0 1 0 0 0
1 0 1 0 5 0 1 0 0 0 0 0 2 0 0
1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
0 0 0 2 0 0 0 2 1 0 0 1 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
当字符匹配的时候,我们并不是简单的给相应元素赋上1,而是赋上其左上角元素的值加一。
我们用两个标记变量来标记矩阵中值最大的元素的位置,在矩阵生成的过程中来判断当前生成的元素的值是不是最大的,
据此来改变标记变量的值,那么到矩阵完成的时候,最长匹配子串的位置和长度就已经出来了。
*/
#include<iostream>
using namespace std;
#define N 1000
char str[N][N];
int main(){
string s1,s2;
cin>>s1>>s2;
int len1=s1.size();
int len2=s2.size();
int i,j;
for(i=0;i<len1;++i){
for(j=0;j<len2;++j){
if(j==0){
if(s1[i]==s2[j])
str[j][i]=1;
else
str[j][i]=0;
}
else{
if(s1[i]==s2[j])
str[j][i]=str[j-1][i-1]+1;
else
str[j][i]=0;
}
}
}
int max=-32768;
for(i=0;i<len1;++i){
for(j=0;j<len2;++j){
if(str[i][j]>max)
max=str[i][j];
}
}
cout<<max<<endl;
return 0;
}
转载于:https://blog.51cto.com/beyond316/1266360