【Lintcode】1702. Distinct Subsequences II（配数学证明）

最新推荐文章于 2022-04-06 14:20:01 发布

记录算法题解

最新推荐文章于 2022-04-06 14:20:01 发布

阅读量135

点赞数

分类专栏： LC 贪心、动态规划与记忆化搜索

本文链接：https://blog.csdn.net/qq_46105170/article/details/111308496

版权

LC 贪心、动态规划与记忆化搜索专栏收录该内容

344 篇文章 5 订阅

订阅专栏

题目地址：

https://www.lintcode.com/problem/distinct-subsequences-ii/description

给定一个长 $n$ 的字符串 $s$ ，问其所有不同的非空子序列一共多少个。

思路是动态规划。容易想到按照子序列的结尾分类，这里的关键是如何去重。我们先写出 $f$ 的递推式，然后解释其正确性： $f[i]=1+\sum_{s[j]\ne s[i],j=0,1,...,i-1}f[j]$ 最后答案就是 $\sum f$ 。这里累加的时候，略过了与 $s [i]$ 相等的字符对应的 $f$ 。如果 $\nexists j<i,s[j]=s[i]$ ，那 $f [i] = 1$ ，这里的 $1$ 计数的就是 $s [0 : i]$ 这个字符串；设 $s [i]$ 在 $s [0 : i - 1]$ 出现的所有位置分别是 $j_1,...,j_k$ 且 $j_k<...<j_1$ ，那么对于 $j_1<k<i$ ，累加 $f [k]$ 所计数的子序列就是 $f [k]$ 所计数的子序列后面接上 $s [i]$ ，而对于 $j_2<k<j_1$ ，累加 $f [k]$ 所计数的子序列就是 $f [k]$ 所计数的子序列后面接上 $s[i]\times 2$ ，以此类推。举例如下：对于 $s = a b a b$ ，那么 $f [0] = 1$ 对应的是 $a$ ， $f [1] = 2$ 对应的是 $b$ 和 $a b$ ，而 $f [2] = 1 + f [1] = 3$ 对应，这里 $1$ 指的是 $a a$ ，而 $f [1]$ 累加的是 $b a$ 和 $a b a$ ，接着 $f [3] = 1 + f [2] + f [0] = 5$ ，这里 $1$ 指的是 $b b$ ，而 $f [2]$ 累加的是之前 $f [2]$ 所代表的 $a a$ 、 $b a$ 和 $a b a$ 后面接上 $s [3] = b$ ，即 $a a b$ 、 $b a b$ 和 $a b a b$ ，而 $f [0]$ 累加的是之前 $f [0]$ 所代表的 $a$ 后面接上 $b\times 2$ ，即 $a b b$ 。列在下面：
$f [0]$ ： $a$
$f [1]$ ： $b$ ； $a b$
$f [2]$ ： $a a$ ； $b a$ ， $a b a$
$f [3]$ ： $b b$ ； $a a b$ ， $b a b$ ， $a b a b$ ； $a b b$
最后答案就是 $11$ 。

我们证明一下上面的算法的正确性：

首先容易看出，任何一个子序列一定会被枚举到（这里可以这样看，任何一个子序列都会在它第一次出现的位置被枚举到，这里的“第一次”出现指的是每个字符都取尽量左边的那个）。接下来只需要证明没有重复即可。这一点可以用数学归纳法证明。对 $s$ 的长度做归纳。我们要证明的结论是，每个子序列会在它第一次出现的位置被枚举到（这句话的意思是它第一次出现的时候，它的最后一个字符所在位置 $i$ 对应的 $f [i]$ 会对其进行计数），并且之后不会重复枚举。当长度为 $1, 2$ 时结论正确。设长度小于 $n$ 的情况下结论也正确，当长度等于 $n$ 的时候。如果有重复，接下来分类讨论。如果最后一个重复的位置是相同的，由归纳假设，前面部分只会在第一次出现的时候枚举到，这就矛盾了；如果最后一个重复的位置不同，一个在 $c = s [n - 1]$ ，另一个在 $c = s [m]$ 并且 $m < n - 1$ ，那么将两个子序列同时去掉最后一个字符，前面的部分，由归纳假设，都是在第一次出现的位置被枚举的，但是前面部分的最后一个字符的下标是小于 $m$ 的，在算 $f [n - 1]$ 的时候枚举不到这个子序列，因为算 $f [n - 1]$ 的时候枚举到的子序列事实上是上面子序列去掉最后一个字符后后面至少接两个 $c$ ，这就矛盾了。所以结论正确。

事实上上面的 $f [i]$ 存的就是，所有以 $s [i]$ 结尾的，并且是第一次出现的子序列的个数。

代码如下：

public class Solution {
    /**
     * @param S: The string s
     * @return: The number of distinct, non-empty subsequences of S.
     */
    public int distinctSubseqII(String S) {
        // Write your code here
        int res = 0, MOD = (int) (1E9 + 7);
        int[] dp = new int[S.length()];
        for (int i = 0; i < S.length(); i++) {
            dp[i] = 1;
            for (int j = 0; j < i; j++) {
                if (S.charAt(j) != S.charAt(i)) {
                    dp[i] += dp[j];
                    dp[i] %= MOD;
                }
            }
        }
        
        for (int i : dp) {
            res += i;
            res %= MOD;
        }
        
        return res;
    }
}

时间复杂度 $O(n^2)$ ，空间 $O (n)$ 。

记录算法题解

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【Lintcode】1702. Distinct Subsequences II（配数学证明）

题目地址：https://www.lintcode.com/problem/distinct-subsequences-ii/description给定一个长nnn的字符串sss，问其所有不同的非空子序列一共多少个。思路是动态规划。容易想到按照子序列的结尾分类，这里的关键是如何去重。我们先写出fff的递推式，然后解释其正确性：f[i]=1+∑s[j]≠s[i],j=0,1,...,i−1f[j]f[i]=1+\sum_{s[j]\ne s[i],j=0,1,...,i-1}f[j]f[i]=1+s[j
复制链接

扫一扫