最长重复子串,最长公共子序列, 最长公共子串
原题:首先这是一个单字符串问题。子字符串R 在字符串L 中至少出现两次,则称R 是L 的重复子串。重复子串又分为可重叠重复子串和不可重叠重复子串,这里只是简单讨论最长可重叠的重复子串,给出基本算法。
最长重复子串
用最笨的方法,逐个扫描,时间复杂度O(N^2), 代码如下,亲测可用:
int LCS::comLen(const char*p, const char *q){//找到两个子串最大的重复部分,并返回重复的字符个数
int len=0;
while( *p && *q && *p++ == *q++)
++len;
return len;
}
int LCS::LongestRepeatSubString(const char*p){
int maxLen = -1;
int maxIndex = -1;
int len = 0;
int m = strlen(p);
for(int i = 0; i < m; ++i){
for (int j = i+1; j < m; ++j){
len = comLen(&p[i], &p[j]);
if(len > maxLen){
maxLen = len;
maxIndex = j;//记录最大重复子串的起始位置,暂时没有用到。
}
}
}
return maxLen;//返回最大的重复个数
}
最长公共子串
最长公共子序列的解法和最长重复子串基本上一样,无非是前者求的是一个串里面的重复子串,也就是公共串,如果放到两个串中就是最长公共子串。代码如下:
int LCS::comLen(const char*p, const char *q){//找到两个子串最大的重复部分,并返回重复的字符个数
int len=0;
while( *p && *q && *p++ == *q++)
++len;
return len;
}
int LCS::LongestRepeatSubString(const char*p, const char* q){
int maxLen = -1;
int maxIndex = -1;
int len = 0;
int m = strlen(p);
int n = strlen(q);
for(int i = 0; i < m; ++i){
for (int j = 0; j < n; ++j){
len = comLen(&p[i], &q[j]);
if(len > maxLen){
maxLen = len;
maxIndex = j;//记录最大重复子串的起始位置,暂时没有用到。
}
}
}
return maxLen;//返回最大的重复个数
}
最长公共子序列
int c[100][100] = {0};
int LCS::LCS_Length(const char* X, const char *Y){
if( X != NULL && Y != NULL){
int m = strlen(X);
int n = strlen(Y);
for (int i = 0; i < m; i++)
c[i][0] = 0;
for (int i = 0; i < n; i++)
c[0][i] = 0;
for(int i = 0; i <m; ++i){
for(int j = 0; j <n; ++j){
if(X[i] == Y[j])
c[i+1][j+1] = c[i][j] + 1;//之所以是c[i+1]是因为字符串访问从0开始
else
c[i+1][j+1] = max(c[i][j+1],c[i+1][j]);
}
}
return c[m][n];
}
return 0;
}