最长公共子串(连续)/子序列(不连续)

一、题目描述

1、【最长公共子串】

计算两个字符串的最长公共子串的长度,字符不区分大小写

假设 X 和 Y 的序列如下:
X[1...m] = {a,s,d,f,a,s,r}
Y[1...n] = {w,e,r,a,s,d,f,a,s,w,e,r}
可以看出,X 和 Y 的最长公共子串为 “a,s,d,f,a,s”,即长度为6

2、【最长公共子序列】

给定两个序列:X[1...m]和Y[1...n],求在两个序列中同时出现的最长子序列的长度。

假设 X 和 Y 的序列如下:
X[1...m] = {A, B, C, B, D, A, B}
Y[1...n] = {B, D, C, A, B, A}
可以看出,X 和 Y 的最长公共子序列有 “BDAB”、“BCAB”、“BCBA”,即长度为4

二、解题思路

1、【最长公共子串】--连续

动态规划思想,设定dp[i][j]记录子串X[1,,i]和子串Y[1,,j]的公共子串长度,则
dp[i][j] = dp[i-1][j-1]+1   ->   X[i]==Y[j]
dp[i][j] = 0

2、【最长公共子序列】--不连续

采用动态规划的思想,设dp[i][j]为序列X[1...i]和序列Y[1...j]的最长公共子序列长度,则
dp[i][j] = dp[i-1][j-1]+1                     ->        X[i]==Y[j]
dp[i][j] = max(dp[i-1][j],dp[i][j-1])     ->        X[i]!=Y[j]

三、解题算法

1、【最长公共子串】--连续

/**********************************
author:tmw
date:2018-10-22
**********************************/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define max(a,b) (a>b?a:b)

int findLongestSubStr(char* X, char* Y, int X_len, int Y_len)
{
    int dp[X_len+1][Y_len+1];
    int i,j;
    int max_continue_len = 0;
    for(i=0; i<=X_len; i++)
        dp[i][0] = 0;
    for(j=0; j<=Y_len; j++)
        dp[0][j] = 0;

    for(i=1; i<=X_len; i++)
    {
        for(j=1; j<=Y_len; j++)
        {
            if(X[i] == Y[j])
            {
                dp[i][j] = dp[i-1][j-1]+1;
                max_continue_len = max(max_continue_len,dp[i][j]);
            }
            else
                dp[i][j] = 0;
        }
    }
    return max_continue_len;
}

2、【最长公共子序列】--不连续

/**********************************
author:tmw
date:2018-10-22
**********************************/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define max(a,b) (a>b?a:b)

int findLongestCommonSubSequence(char* X, char* Y, int X_len, int Y_len)
{
    int dp[X_len+1][Y_len+1];
    int i,j;
    for(i=0; i<X_len; i++)
        for(j=0; j<Y_len; j++)
            dp[i][j] = 0;

    for(i=1; i<=X_len; i++)
    {
        for(j=1; j<=Y_len; j++)
        {
            if(X[i] == Y[j])
                dp[i][j] = dp[i-1][j-1]+1;
            else
                dp[i][j] = max(dp[i-1][j],dp[i][j-1]);
        }
    }
    return dp[X_len][Y_len];
}

 

梦想还是要有的,万一实现了呢~~~~ヾ(◍°∇°◍)ノ゙~~~~~~~~~

最长公共子序列(Longest Common Subsequence, LCS)和最长公共子串(Longest Common Substring)是两个常见的字符串相关问题。 最长公共子序列是指给定两个字符串,要求找到它们之间最长的公共子序列的长度。子序列是从原字符串中删除若干个字符而得到的新字符串,字符在新字符串中的相对顺序与原字符串中的保持一致。动态规划是求解LCS问题的常用方法。 以字符串s1 = "ABCBDAB"和s2 = "BDCAB"为例,可以使用动态规划的方法求解最长公共子序列的长度。首先创建一个二维数组dp,dp[i][j]表示s1的前i个字符和s2的前j个字符之间的最长公共子序列的长度,那么有以下推导关系: 1. 当i=0或j=0时,dp[i][j]=0。 2. 当s1[i-1]=s2[j-1]时,dp[i][j] = dp[i-1][j-1] + 1。 3. 当s1[i-1]!=s2[j-1]时,dp[i][j] = max(dp[i-1][j], dp[i][j-1])。 最后,dp[len(s1)][len(s2)]即为最长公共子序列的长度。 对于最长公共子串,要求找到两个字符串中最长的公共连续子串的长度。连续子串是指在原字符串中连续出现的字符子序列。同样可以使用动态规划来解决该问题。 仍以上述两个字符串s1和s2为例,创建一个二维数组dp,dp[i][j]表示以s1[i-1]和s2[j-1]为结尾的公共子串的长度,那么有以下推导关系: 1. 当i=0或j=0时,dp[i][j]=0。 2. 当s1[i-1]=s2[j-1]时,dp[i][j] = dp[i-1][j-1] + 1。 3. 当s1[i-1]!=s2[j-1]时,dp[i][j] = 0。 最后,dp矩阵中的最大值即为最长公共子串的长度。 以上就是求解最长公共子序列最长公共子串的常见方法。在实际应用中,我们可以根据具体的问题选择合适的方法,并结合动态规划来解决这些字符串相关的问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值