1. 问题描述:
把字符串 s 看作是“abcdefghijklmnopqrstuvwxyz”的无限环绕字符串,所以 s 看起来是这样的:"...zabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcd....". 现在我们有了另一个字符串 p 。你需要的是找出 s 中有多少个唯一的 p 的非空子串,尤其是当你的输入是字符串 p ,你需要输出字符串 s 中 p 的不同的非空子串的数目。 注意: p 仅由小写的英文字母组成,p 的大小可能超过 10000。
示例 1:
输入: "a"
输出: 1
解释: 字符串 S 中只有一个"a"子字符。
示例 2:
输入: "cac"
输出: 2
解释: 字符串 S 中的字符串“cac”只有两个子串“a”、“c”。.
示例 3:
输入: "zab"
输出: 6
解释: 在字符串 S 中有六个子串“z”、“a”、“b”、“za”、“ab”、“zab”。.
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/unique-substrings-in-wraparound-string
2. 思路分析:
首先需要理解题目的意思,题目的主要意思是在字符串p中找出连续的子串的数目,并且当子串相同的时候那么应该归为一种,也即与位置是没有关系的。如果子串与位置是有关系的也即出现相同子串的时候归为不同类的子串的时候其实就很好解决,我们可以使用双指针i,j来计算出子串连续的一段,若长度为k那么子串的数目为1 + 2 + ... k,所以我们的关键是如何判重。如何确定一个子串呢?我们知道如果知道子串的开始位置与长度那么当前这一段子串就确定了(因为判重是核心所以找到这个规律很关键),例如以c开头的子串长度为k,那么长度为1,2,...k的连续子串都有了,所以我们计算出以当前字符开头的最大长度即可,最大长度表示的就是当前字符开头的不重复的子串的数目,最后将结果相加那么就是答案了。
3. 代码如下:
import collections
class Solution:
def findSubstringInWraproundString(self, p: str) -> int:
# 双指针算法
i, j = 0, 0
dic = collections.defaultdict(int)
while i < len(p):
j = i + 1
# 计算连续的一段
while j < len(p) and (ord(p[j]) == ord(p[j - 1]) + 1 or (p[j] == "a" and p[j - 1] == "z")):
j += 1
# 当前的j就是不满足连续的位置
while i < j:
# 更新以当前字符开头的最大长度
dic[p[i]] = max(dic[p[i]], j - i)
i += 1
res = 0
# 累加以当前字符开头的最大长度
for k, v in dic.items():
res += v
return res