LCS问题

LCS问题就是求两个字符串最长公共子串的问题。解法就是用一个矩阵来记录两个字符串中所有位置的两个字符之间的匹配情况,若是匹配则为1,否则为0。然后求出对角线最长的1序列,其对应的位置就是最长匹配子串的位置。

  下面是字符串21232523311324和字符串312123223445的匹配矩阵,前者为X方向的,后者为Y方向的。不难找到,红色部分是最长的匹配子串。通过查找位置我们得到最长的匹配子串为:21232


  0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
  0 1 0 0 0 0 0 0 0 1 1 0 0 0 0
   1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
  0 1 0 0 0 0 0 0 0 1 1 0 0 0 0
  1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
  0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
  1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
  1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
  0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
  0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
  0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
  0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
  0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

  但是在0和1的矩阵中找最长的1对角线序列又要花去一定的时间。通过改进矩阵的生成方式和设置标记变量,可以省去这部分时间。下面是新的矩阵生成方式:

  0 0 0 1 0 0 0 1 1 0 0 1 0 0 0
  0 1 0 0 0 0 0 0 0 2 1 0 0 0 0
   1 0 2 0 1 0 1 0 0 0 0 0 1 0 0
  0 2 0 0 0 0 0 0 0 1 1 0 0 0 0
  1 0 3 0 1 0 1 0 0 0 0 0 1 0 0
  0 0 0 4 0 0 0 2 1 0 0 1 0 0 0
  1 0 1 0 5 0 1 0 0 0 0 0 2 0 0
  1 0 1 0 1 0 1 0 0 0 0 0 1 0 0
  0 0 0 2 0 0 0 2 1 0 0 1 0 0 0
  0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
  0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
  0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
  0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

  不用多说,你大概已经看出来了。当字符匹配的时候,我们并不是简单的给相应元素赋上1,而是赋上其左上角元素的值加一。我们用两个标记变量来标记矩阵中值最大的元素的位置,在矩阵生成的过程中来判断当前生成的元素的值是不是最大的,据此来改变标记变量的值,那么到矩阵完成的时候,最长匹配子串的位置和长度就已经出来了。

  这样做速度比较快,但是花的空间太多。我们注意到在改进的矩阵生成方式当中,每生成一行,前面的那一行就已经没有用了。因此我们只需使用一维数组即可。最终的代码如下:


  Private Function LCS(ByVal str_1 As String, ByVal str_2 As String) As String
  If str_1 = "" Or str_2 = "" Then Return ""

  Dim c(str_1.Length) As Integer
  Dim max, maxj, i, j As Integer
  maxj = 0 : max = 0 '这两个是标志变量
  For i = 0 To str_2.Length - 1
  For j = str_1.Length - 1 To 0 Step -1
  If str_2.Chars(i) = str_1.Chars(j) Then
  If i = 0 Or j = 0 Then
  c(j) = 1
  Else
  c(j) = c(j - 1) + 1
  End If
  Else
  c(j) = 0
  End If
  If c(j) > max Then '把>改成>=则返回最后一个最长匹配子串
  max = c(j) : maxj = j '更新标志变量
  End If
  Next
  Next

  If max = 0 Then Return ""
  Return str_1.Substring(maxj - max + 1, max) '直接从标志变量得出结果
  End Function

  这里的问题大概你也看出来了:如果有多个最长的匹配子串怎么办呢?我这里只能是返回第一个。稍微改一下可以变成返回最后一个。要完整地返回所有最长匹配子串,就需要一个标志变量的数组了  collected by barenx
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是使用动态规划空间优化的 C 代码: ```c #include <stdio.h> #include <string.h> #define MAX_N 1000 int dp[2][MAX_N+1]; int lcs(char* s1, char* s2, int len1, int len2) { int i, j; for (i = 0; i <= len1; i++) { for (j = 0; j <= len2; j++) { if (i == 0 || j == 0) { dp[i%2][j] = 0; } else if (s1[i-1] == s2[j-1]) { dp[i%2][j] = dp[(i-1)%2][j-1] + 1; } else { dp[i%2][j] = (dp[(i-1)%2][j] > dp[i%2][j-1]) ? dp[(i-1)%2][j] : dp[i%2][j-1]; } } } return dp[len1%2][len2]; } int main() { char s1[MAX_N], s2[MAX_N]; scanf("%s%s", s1, s2); int len1 = strlen(s1); int len2 = strlen(s2); printf("%d\n", lcs(s1, s2, len1, len2)); return 0; } ``` 以上代码将原来的二维数组 `dp` 改为了两个一维数组,使用滚动数组的方式实现状态转移。这样可以将空间复杂度从 O(n²) 优化为 O(n)。 以下是使用树状数组优化的 C 代码: ```c #include <stdio.h> #include <string.h> #define MAX_N 1000 int c[MAX_N+1]; int dp[MAX_N+1]; int lowbit(int x) { return x & (-x); } void update(int x, int v, int n) { while (x <= n) { if (dp[x] < v) { dp[x] = v; } x += lowbit(x); } } int query(int x) { int res = 0; while (x > 0) { if (dp[x] > res) { res = dp[x]; } x -= lowbit(x); } return res; } int lcs(char* s1, char* s2, int len1, int len2) { int i, j; for (i = 1; i <= len1; i++) { memset(c, 0, sizeof(c)); for (j = 1; j <= len2; j++) { if (s1[i-1] == s2[j-1]) { int v = query(j-1) + 1; update(j, v, len2); } } } return query(len2); } int main() { char s1[MAX_N], s2[MAX_N]; scanf("%s%s", s1, s2); int len1 = strlen(s1); int len2 = strlen(s2); printf("%d\n", lcs(s1, s2, len1, len2)); return 0; } ``` 以上代码使用了树状数组来维护前缀最长公共子序列的长度。时间复杂度为 O(nlogn)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值