题目描述:
给定两个字符串 s 和 p,找到 s 中所有 p 的 异位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。
异位词 指由相同字母重排列形成的字符串(包括相同的字符串)。
示例 1:
输入: s = "cbaebabacd", p = "abc"
输出: [0,6]
解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的异位词。
示例 2:输入: s = "abab", p = "ab"
输出: [0,1,2]
解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的异位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的异位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的异位词。
提示:
1 <= s.length, p.length <= 3 * 104
s 和 p 仅包含小写字母
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/find-all-anagrams-in-a-string
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
分析:
这道题有点思路,但是会超时。我的想法就是在hash表中存下p的全排列,然后遍历s,看以s[i]开头的子串是否在hash表中,在的话,说明它是异位词,计数。但是,这道题p的范围太大了,以至于全排列会超时。。。只能换别的办法了。
题解里提到了滑动窗口,统计p中每个字母数量,以及s中滑动窗口里每个字母数量,然后比较,如果都相同,说明滑动窗口中的字符串是p的异位词,计数。我又使用hash表统计字母数量,又超时了。。。主要是因为,在比较p中字母数量和滑动窗口的字母数量时,会比较耗时。
按照官方的题解,使用数组进行计数,就通过了。
官方题解如下:
代码如下:
class Solution {
public:
vector<int> findAnagrams(string s, string p) {
int lens=s.size();
int lenp=p.size();
vector<int> res;
if(lens<lenp) return res;
// s_count存储s中滑动窗口的字母数量
vector<int> s_count(26);
// p_count存储p中每个字母的数量
vector<int> p_count(26);
// 初始情况,先对s_conut和p_count进行赋值
for(int i=0;i<lenp;i++)
{
s_count[s[i]-'a']++;
p_count[p[i]-'a']++;
}
// 比较,如果相等,则为异位词
if(s_count==p_count) res.push_back(0);
// 遍历i,统计以s[i]开头的每个滑动窗口,是否为异位词
for(int i=1;i<=lens-lenp;i++)
{
s_count[s[i-1]-'a']--;
s_count[s[i+lenp-1]-'a']++;
if(s_count==p_count) res.push_back(i);
}
return res;
}
};
tips:
当vector里的元素是基本数据类型时,可以直接使用 "==", "!=", ">=","<=" 来对两个vector进行比较。
参考链接: