1. 相关表示
符号 | 含义 | 备注 |
---|---|---|
S [ n ] S[n] S[n] | 表示长度为n的字符串 | |
S [ n ] [ n ] S[n][n] S[n][n] | 二 维 状 态 数 组 二维状态数组 二维状态数组 | S [ i ] [ j ] 表 示 前 i 个 字 符 组 成 的 d i s t i n c t s u b s e q u e n c e s 的 个 数 , 且 该 s u b s e q u e n c e s 的 长 度 为 j + 1 ( 从 0 开 始 ) S[i][j]表示前i个字符组成的distinct subsequences的个数,且该subsequences的长度为j+1(从0开始) S[i][j]表示前i个字符组成的distinctsubsequences的个数,且该subsequences的长度为j+1(从0开始) |
P [ n ] P[n] P[n] | 辅 助 数 组 辅助数组 辅助数组 | P [ i ] 表 示 距 离 字 符 S [ i ] 最 近 且 S [ P [ i ] ] = = S [ i ] P[i]表示距离字符S[i]最近且S[P[i]] == S[i] P[i]表示距离字符S[i]最近且S[P[i]]==S[i] |
2. 状态转移方程:
S [ i ] [ j ] 的 状 态 无 非 和 S [ i − 1 ] [ j − 1 ] , S [ i − 1 ] [ j ] 和 S [ i ] [ j − 1 ] 有 关 。 其 中 , S [ i ] [ j − 1 ] 可 以 直 接 排 除 , 因 为 它 们 之 间 没 有 状 态 转 移 关 系 。 S[i][j]的状态无非和S[i-1][j-1],S[i-1][j]和S[i][j-1]有关。其中,S[i][j-1]可以直接排除,因为它们之间没有状态转移关系。 S[i][j]的状态无非和S[i−1][j−1],S[i−1][j]和S[i][j−1]有关。其中,S[i][j−1]可以直接排除,因为它们之间没有状态转移关系。
a . S [ i − 1 ] [ j ] 表 示 字 符 串 S [ n ] 前 i − 1 个 字 符 包 含 长 度 为 j + 1 的 d i s t i n c t s u b s e q u e n c e s 的 个 数 。 因 为 i > i − 1 , 所 以 S [ i ] [ j ] 包 含 S [ i − 1 ] [ j ] 。 a. S[i-1][j]表示字符串S[n]前i-1个字符包含长度为j+1的distinct \ subsequences的个数。因为i>i-1,所以S[i][j]包含S[i-1][j]。 a.S[i−1][j]表示字符串S[n]前i−1个字符包含长度为j+1的distinct subsequences的个数。因为i>i−1,所以S[i][j]包含S[i−1][j]。
b . S [ i − 1 ] [ j − 1 ] 表 示 字 符 串 S [ n ] 前 i − 1 个 字 符 包 含 长 度 为 j 的 d i s t i n c t s u b s e q u e n c e s 的 个 数 。 所 以 当 新 增 一 个 字 符 S [ i ] 时 , 该 字 符 S [ i ] 同 S [ i − 1 ] [ j − 1 ] 表 示 的 长 度 为 j 的 不 同 的 子 串 可 以 转 换 成 长 度 为 j + 1 的 子 串 。 b. S[i-1][j-1]表示字符串S[n]前i-1个字符包含长度为j的distinct \ subsequences的个数。所以当新增一个字符S[i]时,该字符S[i]同S[i-1][j-1]表示的长度为j的不同的子串可以转换成长度为j+1的子串。 b.S[i−1][j−1]表示字符串S[n]前i−1个字符包含长度为j的distinct subsequences的个数。所以当新增一个字符S[i]时,该字符S[i]同S[i−1][j−1]表示的长度为j的不同的子串可以转换成长度为j+1的子串。
c . 因 为 子 串 长 度 为 j 的 S [ i − 1 ] [ j − 1 ] 是 通 过 和 字 符 S [ i ] 合 并 组 成 子 串 长 度 为 j + 1 S [ i ] [ j ] 的 一 部 分 , 而 这 新 的 一 部 分 , 可 能 会 同 原 本 长 度 为 j + 1 的 S [ i − 1 ] [ j ] 的 重 复 。 重 复 的 部 分 有 一 个 共 性 就 是 都 是 以 字 符 S [ i ] 结 尾 的 。 所 以 只 要 删 除 S [ i − 1 ] [ j ] 中 以 字 符 S [ i ] 结 尾 的 即 可 。 即 删 除 前 i − 1 个 字 符 中 以 S [ i ] 为 结 尾 且 长 度 为 j + 1 的 子 串 。 c. 因为子串长度为j的S[i-1][j-1]是通过和字符S[i]合并组成子串长度为j+1S[i][j]的一部分,而这新的一部分,可能会同原本长度为j+1的S[i-1][j]的重复。重复的部分有一个共性就是都是以字符S[i]结尾的。所以只要删除S[i-1][j]中以字符S[i]结尾的即可。即删除前i-1个字符中以S[i]为结尾且长度为j+1的子串。 c.因为子串长度为j的S[i−1][j−1]是通过和字符S[i]合并组成子串长度为j+1S[i][j]的一部分,而这新的一部分,可能会同原本长度为j+1的S[i−1][j]的重复。重复的部分有一个共性就是都是以字符S[i]结尾的。所以只要删除S[i−1][j]中以字符S[i]结尾的即可。即删除前i−1个字符中以S[i]为结尾且长度为j+1的子串。
具体流程是:先再前i-1个字符找到距离字符S[i]最近且字符等于S[i]的,得到P[i]。P[i]就是该字符的位置。然后可以得到前P[i]-1个字符的长度为j的子串的个数。最后,减去该数。
S [ i ] [ j ] = S [ i − 1 ] [ j − 1 ] + S [ i − 1 ] [ j ] − { 0 P [ i ] = = − 1 , 0 ≤ i , j < n S [ P [ i ] − 1 ] [ j − 1 ] P [ i ] ! = − 1 , 0 ≤ i , j < n S[i][j]=S[i-1][j-1] + S[i-1][j] - \left\{ \begin{array}{rcl} 0 & P[i]==-1 ,0\leq i,j \lt n \\ S[P[i]-1][j-1] & P[i]!=-1 ,0\leq i,j \lt n \end{array} \right. S[i][j]=S[i−1][j−1]+S[i−1][j]−{0S[P[i]−1][j−1]P[i]==−1,0≤i,j<nP[i]!=−1,0≤i,j<n
3. 代码
class Solution {
public:
int distinctSubseqII(string S) {
int i,j;
long long int res = 0;
vector<vector<long long int> > vvi(S.size(),vector<long long int>(S.size()));
vector<int> vi1(S.size());
vector<int> vi2('z'-'a'+1,-1);
for(i=0;i<S.size();++i){
vi1[i] = vi2[S[i]-'a'];
vi2[S[i]-'a']=i;
}
vvi[0][0] = 1; // for pos 0 and max length is 1
for(i=1;i<S.size();++i){ //pos start from pos 1
if(vi1[i]==-1){
vvi[i][0] = vvi[i-1][0]+1; //new character
}else{
vvi[i][0] = vvi[i-1][0];
}
for(j=1;j<=i;++j){
vvi[i][j] = vvi[i-1][j-1] + vvi[i-1][j];
if(vi1[i]!=-1){
if(vi1[i] > 0)
vvi[i][j] -= vvi[vi1[i]-1][j-1];
}
vvi[i][j] %= 1000000007;
}
}
for(i=0;i<S.size();++i){
res += vvi[S.size()-1][i];
res %= 1000000007;
}
return res;
}
};