最长公共子序列

最长公共子序列

问题描述

  最长公共子序列也称作最长公共子串(不要求连续),英文缩写为LCSLongest Common Subsequence)。其定义是,一个序列 S ,如果分别是两个或多个已知序列的子序列,且是所有符合此条件序列中最长的,则 S 称为已知序列的最长公共子序列。

应用

  最长公共子序列是一个十分实用的问题,它可以描述两段文字之间的相似度,即它们的雷同程度,从而能够用来辨别抄袭。对一段文字进行修改之后,计算改动前后文字的最长公共子序列,将除此子序列外的部分提取出来,这种方法判断修改的部分,往往十分准确。简而言之,百度知道、百度百科都用得上。

算法

  动态规划的一个计算两个序列的最长公共子序列的方法如下:

  以两个序列 XY 为例子:

  设有二维数组 f[i,j] 表示 X i 位和 Y j 位之前的最长公共子序列的长度,则有:

  f[1][1] = same(1,1);

  f[i,j] = max{f[i-1][j -1] + same(i,j),f[i-1,j],f[i,j-1]}

  其中,same(a,b) X 的第 a 位与 Y 的第 b 位完全相同时为“1”,否则为“0”

  此时,f[j]中最大的数便是 X Y 的最长公共子序列的长度,依据该数组回溯,便可找出最长公共子序列。

该算法的空间、时间复杂度均为O(n^2),经过优化后,空间复杂度可为O(n)

代码(C++

  #include <cstdlib>

  #include <iostream>

  using namespace std;

  #define N 105

  int dp[N+1][N+1] ;

  char str1[N] , str2[N];

  int maxx(int a , int b)

  {

  if(a > b)

  return a ;

  return b ;

  }

  int LCSL(int len1 , int len2)

  {

  int i , j ;

  int len = maxx(len1 , len2);

  for( i = 0 ; i <= len; i++ )

  {

  dp[i][0] = 0 ;dp[0][i] = 0 ;

  }

  for( i = 1 ; i<= len1 ; i++)

  for( j = 1 ; j <= len2 ; j++)

  {

  if(str1[i - 1] == str2[j - 1])

  {

  dp[i][j] = dp[i - 1][ j - 1] + 1 ;

  }

  else

  {

  dp[i][j] = maxx(dp[i - 1][ j ] , dp[i][j - 1]) ;

  }

  }

  return dp[len1][len2];

  }

  int main()

  {

  while(cin >> str1 >> str2)

  {

  int len1 = strlen(str1) ;

  int len2 = strlen(str2) ;

  cout<<LCSL(len1 , len2)<<endl;

  }

  return 0;

  }

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值