给定一个字符串 s 和一个非空字符串 p,找到 s 中所有是 p 的字母异位词的子串,返回这些子串的起始索引。
字符串只包含小写英文字母,并且字符串 s 和 p 的长度都不超过 20100。
说明:
- 字母异位词指字母相同,但排列不同的字符串。
- 不考虑答案输出的顺序。
示例 1:
输入: s: "cbaebabacd" p: "abc" 输出: [0, 6] 解释: 起始索引等于 0 的子串是 "cba", 它是 "abc" 的字母异位词。 起始索引等于 6 的子串是 "bac", 它是 "abc" 的字母异位词。
示例 2:
输入: s: "abab" p: "ab" 输出: [0, 1, 2] 解释: 起始索引等于 0 的子串是 "ab", 它是 "ab" 的字母异位词。 起始索引等于 1 的子串是 "ba", 它是 "ab" 的字母异位词。 起始索引等于 2 的子串是 "ab", 它是 "ab" 的字母异位词。
题目解析:
使用滑动窗口和哈希表。
定义两个哈希表。pchar代表p串的哈希表,使用Counter函数对字符串p中字符出现的次数进行统计。window_s是我们要滑动的窗口,也用一个哈希表表示。
res存储我们要的结果即重叠字串的起始索引。
用i遍历串s,每次循环都对此时的s[i]计入我们的窗口中。i也可以认为是我们窗口的右边界。当右边界的值大于p元素个数的时候,我们就将左边界中的值移出。窗口不断右移,窗口大小保持不变为len(p)。当两个哈希表相等时,记录结果到res中。
注意!!!!!!
当哈希表中的值为0时,我们要将该元素移除。大坑!!!!即下面这步。
if window_s[s[i-len(p)]]==0:
del window_s[s[i-len(p)]]
整个代码如下:
from collections import Counter
class Solution:
def findAnagrams(self, s: str, p: str) -> List[int]:
p_len = len(p)
pChar = Counter(p)
res = []
window_s = Counter()
if len(s) < len(p):
return res
for i in range(len(s)):
window_s[s[i]] += 1
if i >= len(p):
window_s[s[i - len(p)]] -= 1
if window_s[s[i-len(p)]]==0:
del window_s[s[i-len(p)]]
if window_s == pChar:
res.append(i - len(p)+1)
return res