子串和子序列问题-动态规划向

 1. 子串子序列问题概述

        有关于子序列和子串的问题是字符串或者数组经常会遇到的问题,一般我们经常使用多指针,滑动窗口,回溯,动态规划的方式去解决,而本篇重点关注能用动态规划解决或者说明显使用动态规划解决的子串问题和子序列问题。

1.1 子串

        子串是字符串中的由连续字符组成的一个序列,重点在于连续。例如,"1AB2345CD",那么"1AB23","5CD"都是相应的子串,而"12345CD"不是,已经不是连续的状态。

1.2 子序列

        字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串,那么很明显,子序列和子串最大的区别就是可以是不连续的。例如,"1AB2345CD","12345CD"就是它的一个子序列。

2. leetcode && nowcoder案例实战

1. NC127 最长公共子串

给定两个字符串str1和str2,输出两个字符串的最长公共子串
题目保证str1和str2的最长公共子串存在且唯一。 

输入:
"1AB2345CD","12345EF"
返回值:
"2345"

import java.util.*;


public class Solution {
    /**
     * longest common substring
     * @param str1 string字符串 the string
     * @param str2 string字符串 the string
     * @return string字符串
     */
    public String LCS (String str1, String str2) {
        // write code here
        int[][] dp = new int[str1.length()][str2.length()];
        int max = 0;
        int index = 0;
        if(str1.charAt(0) == str2.charAt(0)) dp[0][0] = 1;
        for(int i = 1; i < str1.length(); i++){
            for(int j = 1; j < str2.length(); j++){
                if(str1.charAt(i) == str2.charAt(j)){
                    dp[i][j] = dp[i-1][j-1]+1;
                    if(dp[i][j] > max){
                        max = dp[i][j];
                        index = i-max+1;
                    }
                }
                else{
                    dp[i][j] = 0;
                }
            }
        }
        return str1.substring(index,index+max);
    }
}

分别想象成两个指针,分别重头到尾遍历,如下图所示。 

如果指针指向的内容相同,那么就是

dp[i][j] = dp[i][j] + 1

如果不同

 dp[i][j] = 0

本体小结:(1)dp[i][j]表示字符串str1中第i个字符和str2种第j个字符为最后一个元素所构成的最长公共子串

                  (2)由于记录的是以i和j为结尾最大的,所以在比较过程中要是可保留最大值

2. leetcode647 回文子串

给你一个字符串 s ,请你统计并返回这个字符串中 回文子串 的数目。

回文字符串 是正着读和倒过来读一样的字符串。

子字符串 是字符串中的由连续字符组成的一个序列。

具有不同开始位置或结束位置的子串,即使是由相同的字符组成,也会被视作不同的子串。

输入:s = "aaa"
输出:6
解释:6个回文子串: "a", "a", "a", "aa", "aa", "aaa"

class Solution {
    public int countSubstrings(String s) {
        if(s.length() < 2) return 1;
        boolean[][] dp = new boolean[s.length()][s.length()];
        int count = 0;
        for(int i = 0; i < s.length(); i++){
            for(int j = 0; j <= i; j++){
                if(s.charAt(i) == s.charAt(j)){
                    if(i - j < 2 || dp[i-1][j+1]){
                        dp[i][j] = true;
                        count++;
                    }
                }
            }
        } 
        return count;
    }
}

dp[i][j] 表示字符串s在[i,j]区间的子串是否是一个回文串;

当dp[i][j] = true 代表在(i,j)之间的子串是个回文串;

当dp[i][j] = false 代表在(i,j)之间的子串不是个回文串;

分为三种情况:(1)当s.charAt(i) != s.charAt(j) 那么把这个区间设置为false

                         (2)当s.charAt(i) == s.charAt(j) 那么需要考虑 i-1和j+1的位置的情况

                         (3)如果i和j的举例少于2证明子串是一个或者两个,就不需要考虑i-1和j+1了

本题小结:(1)把s.charAt(i) 和 s.charAt(j)之间的问题转换为i-1和j+1的问题

                  (2)注意特例i - j < 2的情况

3. leetcode5 最长回文子串

给你一个字符串 s,找到 s 中最长的回文子串。

输入:s = "babad"
输出:"bab"
解释:"aba" 同样是符合题意的答案。

class Solution {
    public String longestPalindrome(String s) {
        if(s.length() < 2) return s;
        int maxlen = 1;
        int len = s.length();
        int index = 0;
        boolean[][] dp = new boolean[len][len];
        for(int i = 0; i < len; i++){
            for(int j = 0; j <=i; j++){
                if(s.charAt(i) == s.charAt(j)){
                    if(i- j < 2 || dp[i-1][j+1]){
                        dp[i][j] = true;
                        if(i-j+1 > maxlen){
                            maxlen = i-j+1;
                            index = j;
                        }
                    }
                }
            }
        }
        return s.substring(index,index+maxlen);
    }
}

和上题(leetcode647 回文子串) 相同 

dp[i][j] 表示字符串s在[i,j]区间的子串是否是一个回文串;

当dp[i][j] = true 代表在(i,j)之间的子串是个回文串;

当dp[i][j] = false 代表在(i,j)之间的子串不是个回文串;

本题小结:(1)本题就是需要保存一个长度的变量和其起始的位置,其他的思想和上题相同

4. leetcode1143 最长公共子序列

给定两个字符串 text1 和 text2,返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 ,返回 0 。

一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。

例如,"ace" 是 "abcde" 的子序列,但 "aec" 不是 "abcde" 的子序列。
两个字符串的 公共子序列 是这两个字符串所共同拥有的子序列。


输入:text1 = "abcde", text2 = "ace" 
输出:3  
解释:最长公共子序列是 "ace" ,它的长度为 3 。 

class Solution {
    public int longestCommonSubsequence(String text1, String text2) {
        int[][] dp = new int[text1.length()+1][text2.length()+1];
        // if(text1.charAt(0) == text2.charAt(0)) dp[0][0] = 1;
        for(int i = 1; i <= text1.length(); i++){
            for(int j = 1; j <= text2.length(); j++){
                if(text1.charAt(i-1) == text2.charAt(j-1)){
                    dp[i][j] = dp[i-1][j-1]+1;
                }
                else{
                    dp[i][j] = Math.max(dp[i-1][j],dp[i][j-1]);
                }
            }
        }
        return dp[text1.length()][text2.length()];
    }
}

 dp[i][j] 表示 text1[0:i-1] 和 text2[0:j-1] 的最长公共子序列

“ 当 text1[i - 1] == text2[j - 1] 时,说明两个子字符串的最后一位相等,所以最长公共子序列又增加了 1,所以 dp[i][j] = dp[i - 1][j - 1] + 1;举个例子,比如对于 ac 和 bc 而言,他们的最长公共子序列的长度等于 a 和 b 的最长公共子序列长度 0 + 1 = 1。

当 text1[i - 1] != text2[j - 1] 时,说明两个子字符串的最后一位不相等,那么此时的状态 dp[i][j] 应该是 dp[i - 1][j] 和 dp[i][j - 1] 的最大值。举个例子,比如对于 ace 和 bc 而言,他们的最长公共子序列的长度等于 ① ace 和 b 的最长公共子序列长度0 与 ② ac 和 bc 的最长公共子序列长度1 的最大值,即 1。”   ----------【1】

当text1.charAt(i-1) == text2.charAt(j-1)

        dp[i][j] = dp[i-1][j-1] + 1

当text1.charAt(i-1) != text2.charAt(j-1)

        dp[i][j] = Math.max(dp[i-1][j],dp[i][j-1])

本题小结:(1)不能先使用if(text1.charAt(0) == text2.charAt(0)) dp[0][0] = 1会漏掉状态

 5. leetcode300 最长递增子序列

给你一个整数数组 nums ,找到其中最长严格递增子序列的长度。

子序列 是由数组派生而来的序列,删除(或不删除)数组中的元素而不改变其余元素的顺序。例如,[3,6,2,7] 是数组 [0,3,1,6,2,2,7] 的子序列。

输入:nums = [10,9,2,5,3,7,101,18]
输出:4
解释:最长递增子序列是 [2,3,7,101],因此长度为 4 。

class Solution {
    public int lengthOfLIS(int[] nums) {
        int len =nums.length;
        int[] dp = new int[len+1];
        Arrays.fill(dp,1);
        int max = 1;
        for(int i = 0; i < len-1; i++){
            for(int j = i+1; j < len; j++){
                if(nums[j] > nums[i]) {
                    dp[j] =Math.max(dp[j],dp[i]+1);
                    max = Math.max(dp[j],max);
                }
            }
        }
        return max;
    }
}

dp[i] 表示:以 nums[i] 结尾 的「上升子序列」的长度

当猴一面一个数dp[j] > 前面一个数dp[i]时:

dp[j] = dp[i] + 1

然后选取最大值:

dp[j] =Math.max(dp[j],dp[i]+1)

黄色:已确定好数值区间得dp[i],j为要求得dp值 

本题小结:(1)dp[i]代表以i为结尾的上升子序列,要在比较过程中保留最大值

 6. leetcode516 最长回文子序列


给你一个字符串 s ,找出其中最长的回文子序列,并返回该序列的长度。

子序列定义为:不改变剩余字符顺序的情况下,删除某些字符或者不删除任何字符形成的一个序列。

输入:s = "bbbab"
输出:4
解释:一个可能的最长回文子序列为 "bbbb" 。
 

class Solution {
    public int longestPalindromeSubseq(String s) {
        int len = s.length();
        int[][] dp = new int[len][len];
        for(int i = len-1; i >= 0; i--){
            dp[i][i] = 1;
            for(int j = i+1; j < len; j++){
                if(s.charAt(i) == s.charAt(j)){
                    dp[i][j] = dp[i+1][j-1] + 2;
                }
                else{
                    dp[i][j] = Math.max(dp[i+1][j],dp[i][j-1]);
                }
            }
        }
        return dp[0][len-1];
    }
}

dp[i][j] 代表从i到j的区间(左闭右闭)内最长的回文子序列的长度

那么,当s.charAt(i) == s.charAt(j)

dp[i][j] = dp[i+1][j-1] + 2

当s.charAt(i) != s.charAt(j)

dp[i][j] = Math.max(dp[i+1][j],dp[i][j-1])

为何从尾到头遍历?

先看i在右边的情况:

那么很容易得到状态方程:

聪明的你已经发现了,当前状态是不能既由前方向和后方向一起得到的,动态规划的转移方程只能由已知的部分转移而来。

再看i在左边的情况:

到这里就熟悉了许多,经典三个角地推。 很容得出i要先知道i+1的信息,所以i从后往前推。

本题小结:(1)为何从尾到头遍历要注意以及dp[i][i] = 1要注意初始化

参考来源:(1)leetcode 负雪明烛 二维动态规划的常规套路

                  (2)牛客 数据结构和算法 动态规划解最长公共子串 

                  (3)leetcode jawhiow 两道回文子串的解法(详解中心扩展法) 

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
最长公共子序列(Longest Common Subsequence, 简称LCS)问题一个经典的动态规划问题。LCS问题的目标是找到两个序列中最长的公共子序列的长度。 首先,我们需要理解LCS的定义。根据引用,两个序列的LCS包含了这两个序列的前缀的最长公共子序列。换句话说,我们可以通过比较两个序列的最后一个元素是否相等来确定LCS。如果最后一个元素相等,则LCS的长度会增加1;如果最后一个元素不相等,则我们需要考虑将某个序列的最后一个元素舍弃,然后求解剩余序列的LCS。因此,LCS问题具有最优子结构性质。 根据引用,需要注意最长公共子串(Longest Common Substring)和最长公共子序列(LCS)的区别。最长公共子串一个连续的部分,而最长公共子序列则是从不改变序列的顺序,而从序列中去掉任意的元素而获得新的序列。简单来说,子串字符的位置必须是连续的,而子序列则可以不必连续。 接下来,我们可以通过动态规划方法解决LCS问题动态规划是一种将问题分解为子问题并存储子问题解的方法。我们可以使用一个二维数组来存储子问题解,其中数组元素dp[i][j]表示序列1的前i个元素和序列2的前j个元素的LCS的长度。 具体的动态规划算法如下: 1. 初始化一个二维数组dp,其中dp[i][j]的初始值为0。 2. 从左到右遍历序列1的每个元素,同时从上到下遍历序列2的每个元素。 3. 如果序列1的第i个元素与序列2的第j个元素相等,则dp[i][j]的值等于dp[i-1][j-1]加1。 4. 如果序列1的第i个元素与序列2的第j个元素不相等,则dp[i][j]的值等于dp[i-1][j]和dp[i][j-1]中的较大值。 5. 最终,dp[m][n]即为序列1和序列2的LCS的长度,其中m和n分别为序列1和序列2的长度。 通过上述动态规划算法,我们可以求解最长公共子序列的长度。如果需要求解具体的最长公共子序列,我们可以根据dp数组的构建过程进行回溯。 综上所述,使用动态规划方法可以解决最长公共子序列问题动态规划算法的核心思想是将问题分解为子问题并存储子问题解,通过填充dp数组可以求解最长公共子序列的长度。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值