给定两个字符串 s
和 p
,找到 s
中所有 p
的
异位词
的子串,返回这些子串的起始索引。不考虑答案输出的顺序。
示例 1:
输入: s = "cbaebabacd", p = "abc" 输出: [0,6] 解释: 起始索引等于 0 的子串是 "cba", 它是 "abc" 的异位词。 起始索引等于 6 的子串是 "bac", 它是 "abc" 的异位词。
示例 2:
输入: s = "abab", p = "ab" 输出: [0,1,2] 解释: 起始索引等于 0 的子串是 "ab", 它是 "ab" 的异位词。 起始索引等于 1 的子串是 "ba", 它是 "ab" 的异位词。 起始索引等于 2 的子串是 "ab", 它是 "ab" 的异位词。
提示:
1 <= s.length, p.length <= 3 * 104
s
和p
仅包含小写字母
class Solution {
public:
vector<int> findAnagrams(string s, string p) {
vector<int> ans;
vector<int> cur(26,0);
vector<int> win(26,0);
if(s.size()<p.size()) {
return ans;
}
for(char c : p){
cur[c-'a']++;
}
for(int i=0;i<s.size();i++){
win[s[i]-'a']++;
if(i>=p.size()){
win[s[i-p.size()]-'a']--;
}
if(win==cur){
ans.push_back(i-p.size()+1);
}
}
return ans;
}
};
cur
数组存储字符串 p
中每个字符的频率。
win
数组存储滑动窗口当前的字符频率。每个索引对应一个字母的出现频率,例如 win[0]
表示字母 'a'
的频率,win[1]
表示字母 'b'
的频率,依此类推。
当我们滑动窗口时,对于每个新的字符 s[i]
,我们会增加 win[s[i] - 'a']
的值,表示该字符出现了一次。
如果窗口的大小超出了 p.size()
,移除窗口左边的字符,减去 win[s[i - p.size()] - 'a']
的值。
如果窗口的大小已经超过 p.size()
,则移除窗口左侧的字符(即左边的字符频率减 1)
注意:i - p.size() + 1 是窗口的起始索引