题目: 找到字符串中所有字母异位词
https://leetcode-cn.com/problems/find-all-anagrams-in-a-string/
题目描述
给定两个字符串 s 和 p,找到 s 中所有 p 的 异位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。
异位词 指由相同字母重排列形成的字符串(包括相同的字符串)。
示例 1:
输入: s = "cbaebabacd", p = "abc"
输出: [0,6]
解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的异位词。
示例 2:
输入: s = "abab", p = "ab"
输出: [0,1,2]
解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的异位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的异位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的异位词。
提示:
1 <= s.length, p.length <= 3 * 104
s 和 p 仅包含小写字母
前置知识
双指针与滑动窗口
双指针模板
for (int i = 0, j = 0; i < n; i ++ )
{
while (j < i && check(i, j)) j ++ ;
// 具体问题的逻辑
}
常见问题分类:
(1) 对于一个序列,用两个指针维护一段区间
(2) 对于两个序列,维护某种次序,比如归并排序中合并两个有序序列的操作
思路
先统计字符串p所有字母出现的个数,利用双指针i, j在字符串s上维护一个和字符串p长度相同的区间,该区间不断向后滑动,比较这个区间内是否是字符串p的异位词。
伪代码如下所示:
初始化前后指针 = 0
初始化 结果集合res
for 前指针 in 字符串p
更新窗口内信息(前指针进窗口,后指针出窗口)
后指针移动
判断是否是异位词,更新答案
返回 res
关键点
如何快速比较这个区间内是否是字符串p的异位词?
i
,
j
i,j
i,j所维护的一个和字符串p长度相同的区间
[
j
,
i
]
[j, i]
[j,i], i为前指针,j为后指针,该区间长度不会变化,每次向后移动一格,那么只涉及到前指针
i
i
i和后指针
j
j
j对结果有影响;前指针进窗口某种字母的个数+1, 后指针出窗口某种字符的个数-1
对于异位词,需要含有字母的种类和数量相同。先计算出字符串p有多少种字母以及对应的数量。其次,我们维护一个变量
s
a
m
e
same
same,
s
a
m
e
same
same代表该区间长度的字符串,有多少个和字符串p包含的字母及其数量相同的,例如,字符串p为
a
a
b
b
c
c
c
aabbccc
aabbccc,字符串s为
c
b
c
a
c
a
cbcaca
cbcaca,字符串s的
s
a
m
e
same
same值为2,当
s
a
m
e
same
same值等于字符串p的字母种数时,说明该字符串是p的异位词,因为他们包含的字母种类及其数量都相同。
那么回到滑动窗口,头指针i进窗口,对应字母的数量+1,如果该头指针对应的字母的数量=字符串p该字母的数量,same+1;若窗口大于字符串p的长度,尾指针出窗口, 尾指针对应字母的数量-1。如果该尾指针对应的字母的数量=字符串p该字母的数量,same-1;最后判断
s
a
m
e
same
same是否等于字符串p的字母种数,是则说明是异位词,加入结果
代码
C++ Code:
class Solution {
public:
int cnts[26], cntp[26]; // 分别统计字符串s,p的各个字母的个数
vector<int> findAnagrams(string s, string p) {
int plen = p.size();
for(auto x : p) cntp[x - 'a']++; // 统计字符串p各个字母出现的次数
int wordcnt = 0; // 字符串p字母种数
for(int i = 0; i < 26; i ++ ) wordcnt += (cntp[i] != 0); // 统计字符串p有多少种字母
int n = s.size(), same = 0;
vector<int> res;
for(int i = 0, j = 0; i < n; i ++ )
{
cnts[s[i] - 'a'] ++; // 头指针i进窗口,对应字母的数量+1
if(cnts[s[i] - 'a'] == cntp[s[i] - 'a']) same++; //如果该头指针对应的字母的数量=字符串p该字母的数量,same+1
if(i - j + 1 > plen) // 窗口大于字符串p的长度
{
if(cnts[s[j] - 'a'] == cntp[s[j] - 'a']) same--; // 如果该尾指针对应的字母的数量=字符串p该字母的数量,same-1
cnts[s[j] - 'a']--; // 尾指针对应字母的数量-1
j++; // 尾指针出窗口
}
if(same == wordcnt) res.push_back(j); // 判断same是否等于字符串p的字母种数
}
return res;
}
};
复杂度分析
n 为数组长度。
- 时间复杂度: O ( n ) O(n) O(n)
- 空间复杂度: O ( n ) O(n) O(n)