网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
求两个序列中最长的公共子序列算法,广泛的应用在图形相似处理、媒体流的相似比较、计算生物学方面。生物学家常常利用该算法进行基因序列比对,由此推测序列的结构、功能和演化过程。
LCS可以描述两段文字之间的“相似度”,即它们的雷同程度,从而能够用来辨别抄袭。另一方面,对一段文字进行修改之后,计算改动前后文字的最长公共子序列,将除此子序列外的部分提取出来,这种方法判断修改的部分,往往十分准确。简而言之,百度知道、百度百科都用得上。
三、暴力破解:穷举法
1)假定序列X,Y的长度分别为m,n;
2)X的一个子序列即下标序列{1, 2, …, m}的严格递增子序列,因此,X共有2m个不同子序列;同理,Y有2n个不同子序列,从而穷举搜索法需要指数时间O(2m . 2n);
3)对X的每一个子序列,检查它是否也是Y的子序列,从而确定它是否为X和Y的公共子序列,并且在检查过程中选出最长的公共子序列;
显然,不可取。
四、LCS解法
什么是LCS记号?
结尾符相等时
若Xm = Yn(最后一个字符相同),则:Xm与Yn的最长公共子序列Zk的最后一个字符必定为Xm(也=Yn)。
即有:
Zk= Xm= Yn
LCS(Xm,Yn) = LCS(Xm-1,Yn-1)+Xm
公式:
举例:
结尾符不相等时
1)如果xm≠yn,那么zk≠xm意味着Z是xm-1和Y的一个LCS。也就是
LCS(Xm,Yn)=LCS(Xm-1,Yn)
2)如果xm≠yn,那么zk≠yn意味着Z是X和Yn-1的一个LCS。也就是,
LCS(Xm,Yn)=LCS(Xm,Yn-1)
公式:
举例:
总结
五、LCS代码
伪代码:
举例:
代码(仅计算LCS长度):
int Lcs_length(string s1, string s2)
{
int m = s1.size(); //字符串1的长度
int n = s2.size();
//int dp[m + 1][n + 1];
vector<vector<int> > dp(m+1,vector<int>(n+1,0));
for (int j = 0; j < n; ++j)
dp[0][j] = 0; //first rank init 0
for (int i = 0; i < m; ++i)
dp[i][0] = 0; //first column init 0
for (int i = 1; i <= m; ++i)
for (int j = 1; j <= n; ++j)
{
if (s1[i] == s2[j])
{
dp[i][j] = dp[i - 1][j - 1] + 1;
}
else
{
dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]); //max value
}
}
return dp[m][n];
}
代码(计算LCS长度并打印其中一个公共子序列):
void Lcs_lengthAndStr(string s1, string s2)
![img](https://img-blog.csdnimg.cn/img_convert/834ff78d578e5e52c43bedddca19975f.png)
![img](https://img-blog.csdnimg.cn/img_convert/e3d3ed6700d55999656ee48d78b43740.png)
**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**
**[需要这份系统化的资料的朋友,可以添加戳这里获取](https://bbs.csdn.net/topics/618668825)**
**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**
https://bbs.csdn.net/topics/618668825)**
**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**