环绕字符串中唯一的子字符串
把字符串 s 看作是 “abcdefghijklmnopqrstuvwxyz” 的无限环绕字符串,所以 s 看起来是这样的:
- “…zabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcd…” .
现在给定另一个字符串 p 。返回 s 中 唯一 的 p 的 非空子串 的数量 。
示例 1:
输入: p = “a”
输出: 1
解释: 字符串 s 中只有一个"a"子字符。
示例 2:
输入: p = “cac”
输出: 2
解释: 字符串 s 中的字符串“cac”只有两个子串“a”、“c”。
示例 3:
输入: p = “zab”
输出: 6
解释: 在字符串 s 中有六个子串“z”、“a”、“b”、“za”、“ab”、“zab”。
解:
思路:
由于 s 是周期字符串,对于在 s 中的子串,只要知道子串的第一个字符(或最后一个字符)和子串长度,就能确定这个子串。
例如子串以 “d” 结尾,长度为 3,那么该子串为“bcd”。
题目要求不同的子串个数,那么对于两个以同一个字符结尾的子串,长的那个子串必然包含短的那个。
例如 “abcd” 和“bcd” 均以“d” 结尾,“bcd” 是 “abcd” 的子串。
据此,我们可以定义 dp[α] 表示 p 中以字符 α 结尾且在 s 中的子串的最长长度,知道了最长长度,也就知道了不同的子串的个数。
如何计算 dp[α] 呢?我们可以在遍历 p 时,维护连续递增的子串长度 k。
具体来说,遍历到 p[i] 时,如果 p[i] 是 p[i-1] 在字母表中的下一个字母,则将 k 加一,否则将 k 置为 1,表示重新开始计算连续递增的子串长度。然后,用 k 更新 dp[p[i]] 的最大值。
遍历结束后,pp 中以字符 cc 结尾且在 s 中的子串有 dp[c] 个。
例如 dp[‘d’]=3 表示子串“bcd”、“cd” 和 “d”。
最后答案为:
∑ α = ′ a ′ ′ z ′ d p [ α ] \sum_{α='a'}^{'z'}dp[α] α=′a′∑′z′dp[α]
class Solution {
public:
int findSubstringInWraproundString(string p) {
vector<int> dp(26);
int k = 0;
for (int i = 0; i < p.length(); ++i) {
if (i && (p[i] - p[i - 1] + 26) % 26 == 1) { // 字符之差为 1 或 -25
++k;
} else {
k = 1;
}
dp[p[i] - 'a'] = max(dp[p[i] - 'a'], k);
}
return accumulate(dp.begin(), dp.end(), 0);
}
};