QUESTION
easy
题目描述
给定一个字符串 s 和一个非空字符串 p,找到 s 中所有是 p 的字母异位词的子串,返回这些子串的起始索引。
字符串只包含小写英文字母,并且字符串 s 和 p 的长度都不超过 20100。
示例 1:
输入:
s: "cbaebabacd" p: "abc"
输出:
[0, 6]
解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的字母异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的字母异位词。
示例 2:
输入:
s: "abab" p: "ab"
输出:
[0, 1, 2]
解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的字母异位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的字母异位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的字母异位词。
说明
- 字母异位词指字母相同,但排列不同的字符串。
- 不考虑答案输出的顺序。
SOLUTION
一开始想用一个简单又省事的暴力方法(如下),通过排序字符串,然后进行简单的匹配的答案,但是这样的方法对付不了很大的案例,果不其然,时间超限。
class Solution {
public:
vector<int> findAnagrams(string s, string p) {
int sLen = s.size(), pLen = p.size();
vector<int> res;
sort(p.begin(), p.end());
for(int i = 0 ; i < sLen - pLen + 1; i++){
string substr(s.begin() + i, s.begin() + i + pLen);
sort(substr.begin(), substr.end());
if(p == substr) res.push_back(i);
}
return res;
}
};
方法一
排序如果超时,那么剩下的只有通过统计字符数来判断字母异位词了。
- 只有小写字母,用一个
cnt(26,0)
作为hash
表统计模式串 p 的字符数 - 在
s
串中循环每次都复制cnt
,如果出现某个值 < 0 则直接跳过
耗时很长,但还是 AC 了,感觉在超时的边缘疯狂徘徊
class Solution {
public:
vector<int> findAnagrams(string s, string p) {
int sLen = s.size(), pLen = p.size();
vector<int> res, cnt(26, 0);
for(char c : p) cnt[c - 'a']++;
for(int i = 0 ; i <= sLen - pLen; i++){
vector<int> tmp = cnt;
bool flag = true;
for(int j = 0; j < pLen; j++){
tmp[s[i+j] - 'a']--;
if(tmp[s[i+j] - 'a'] < 0) {
flag = false;
break;
}
}
if(flag) res.push_back(i);
}
return res;
}
};
方法二
暂时没什么想法,看了一下耗时很短的答案,惊到我了,这种方法才应该是优秀的解法。
vp
为 p 串的字符统计vs
是一个动态的字符统计,每次通过对比 vs 与 vp 完成同字母异位词的比对
相比方法一,减少了很多重复统计的情况,在最后的耗时中快了 30 倍
class Solution {
public:
vector<int> findAnagrams(string s, string p) {
int sLen = s.size(), pLen = p.size();
if(pLen > sLen) return {};
vector<int> res, vs(26,0), vp(26,0);
int start = 0;
for(int i = 0; i < pLen; i++){
vs[s[i]-'a']++;
vp[p[i]-'a']++;
}
if(vs == vp) res.push_back(start);
for(int i = pLen; i < sLen; i++){
vs[s[start]-'a']--;
vs[s[i]-'a']++;
start++;
if(vs == vp) res.push_back(start);
}
return res;
}
};