题目描述
给你两个字符串 s 和 t ,统计并返回在 s 的 子序列 中 t 出现的个数,结果需要对 109 + 7 取模。
示例:
输入:s = "babgbag", t = "bag"
输出:5
解释:
如下所示, 有 5 种可以从 s 中得到 "bag" 的方案。
babgbag
babgbag
babgbag
babgbag
babgbag
为了解决这个问题,我们首先需要理解题目中的关键概念:“子序列”和“出现的个数”。子序列是指从原字符串中删除一些(或者不删除)字符而不改变剩余字符的相对顺序所得到的新字符串。例如,字符串 "abc" 的子序列包括 "a", "b", "c", "ab", "ac", "bc", "abc", ""(空字符串)等。
接下来,我们要计算在字符串 s
的所有子序列中,字符串 t
出现的次数。这可以通过动态规划(Dynamic Programming, DP)来有效地解决。
解题思路
我们可以使用二维数组 dp[i][j]
来表示状态,其中 dp[i][j]
表示 s
的前 i
个字符(即 s[0...i-1]
)中包含 t
的前 j
个字符(即 t[0...j-1]
)作为子序列的个数。注意这里的 i
和 j
都是从 1 开始的,方便处理边界情况。
-
初始化:
dp[0][j] = 0
对于所有的j
(因为空字符串不包含任何非空字符串的子序列),dp[i][0] = 1
对于所有的i
(因为任何字符串都包含空字符串作为子序列)。 -
状态转移方程:
- 如果
s[i-1] == t[j-1]
,则有两种情况:- 包含当前字符
s[i-1]
作为t[j-1]
的一部分:dp[i-1][j-1]
- 不包含当前字符
s[i-1]
:dp[i-1][j]
因此,dp[i][j] = dp[i-1][j-1] + dp[i-1][j]
。
- 包含当前字符
- 如果
s[i-1] != t[j-1]
,则只有一种情况:- 不包含当前字符
s[i-1]
:dp[i-1][j]
因此,dp[i][j] = dp[i-1][j]
。
- 不包含当前字符
- 如果
-
结果:
dp[n][m]
,其中 n 和 m 分别是字符串s
和t
的长度。
怎样想到这样状态方程的?
一点个人经验,见过的很多2个串的题,大部分都是dp[i][j] 分别表示s串[0...i] 和t串[0...j]怎么怎么样然后都是观察s[i]和t[j]分等或者不等的情况 而且方程通常就是 dp[i-1][j-1] 要么+ 要么 || dp[i-1][j]类似的。
class Solution {
public:
const int MOD = 1e9 + 7;
int numDistinct(string s, string t) {
int n = s.size();
int m = t.size();
vector<vector<int>> dp(n+1, vector<int>(m+1, 0));
//dp[i][j]: t[0~j]子串在 s[0~i]子序列中出现的个数
for(int i=0;i<n;i++){
dp[i][0] = 1;//空字符串是任何字符串的子序列
}
for(int i=1;i<=n;i++){
for(int j=1;j<=m;j++){
if(j>i)
continue;//无法在较小的字符串中出现更大的字符串
if(s[i-1] == t[j-1]){
dp[i][j] = (dp[i-1][j-1] + dp[i-1][j])%MOD;
}
else{
dp[i][j] = dp[i-1][j];
}
}
}
return dp[n][m];
}
};