/*求两个字符串的最大公共子串
算法原理
LCS[i,j] = 0 (i<0||j<0)
LCS(i-1,j-1) (i>=0 && b>0 && (str1[i]==str2[j]))
(1) 构造一个str1.size()*str2.size()的矩阵vec
(2) 如果 str1[i] == str2[j],则vec[i][j] = vec[i-1][j-1]+1;
LCS (Longest Common Subsequence) 算法用于找出两个字符串最长公共子串。
算法原理:
(1) 将两个字符串分别以行和列组成矩阵。
(2) 计算每个节点行列字符是否相同,如相同则为 1。
(3) 通过找出值为 1 的最长对角线即可得到最长公共子串。
人 民 共 和 时 代
中 0, 0, 0, 0, 0, 0
华 0, 0, 0, 0, 0, 0
人 1, 0, 0, 0, 0, 0
民 0, 1, 0, 0, 0, 0
共 0, 0, 1, 0, 0, 0
和 0, 0, 0, 1, 0, 0
国 0, 0, 0, 0, 0, 0
为进一步提升该算法,我们可以将字符相同节点(1)的值加上左上角(d[i-1, j-1])的值,
这样即可获得最大公用子串的长度。如此一来只需以行号和最大值为条件即可截取最大子串。
人 民 共 和 时 代
中 0, 0, 0, 0, 0, 0
华 0, 0, 0, 0, 0, 0
人 1, 0, 0, 0, 0, 0
民 0, 2, 0, 0, 0, 0
共 0, 0, 3, 0, 0, 0
和 0, 0, 0, 4, 0, 0
国 0, 0, 0, 0, 0, 0
*/
#include <iostream>
#include <stdlib.h>
#include <string>
#include <vector>
using namespace std;
string LCS(string const &str1,string const & str2)
{
if(str1.size()>str2.size())
return LCS(str2,str1);
vector<vector<int> > vec;
vec.resize(str1.size());
for(int i=0;i<(int)str1.size();++i)
{
vec[i].resize(str2.size());
}
int iIndex = -1;
int iMax = 0;
for(int i = 0;i<(int)str1.size();++i)
{
for(int j = 0;j<(int)str2.size();++j)
{
if(str1[i] == str2[j])
{
int n = 1+((i>0&&j>0)?vec[i-1][j-1]:0);
vec[i][j] = n;
if(iMax<n)
{
iMax = n;
iIndex = i;
}
}
}
}
if(iIndex == -1)
return "";
return str1.substr(iIndex-iMax+1,iMax);
}
int main()
{
string a = "adsdfefsdfghgh";
string b = "agahergaersdfefddd";
cout << LCS(a,b) << endl;
system("pause");
return 0;
}
求两个字符串的最大公共子串
最新推荐文章于 2020-11-22 12:27:30 发布