什么时候用滑动窗口?为什么这么用?
定长窗口
方法:
固定窗口长度不变,使用该窗口在序列中滑动,判断当前窗口中的元素跟目标是否匹配
567.字符串的排列
- 方法
- 固定窗口,由于排列不会改变字符串中每个字符的个数,所以只有当两个字符串每个字符的个数均相等时,一个字符串才是另一个字符串的排列。所以可以通过对应元素个数是否相等来判断是否匹配。数组cnt1表示s1中每个字符出现的次数,数组cnt2表示s2窗口中每个元素出现的次数。判断两个数组是否相等就可以。
- 对上面优化,因为每次滑动窗口,只统计了一进一出两个字符,但是要比较整个数组,浪费资源。所以使用一个diff变量来记录cnt1和cnt2中不同值的个数,这样当diff为零时,cnt1与cnt2相等。
对于一进一出的字符 x,y:
若x==y 无影响,直接跳过
若x!=y :
对于x在修改cnt2之前若cnt2[x]=cnt1[x],说明原来的是相等的,现在加了x后肯定不等,所以diff+1;在修改完cnt2之后,若cnt2[x]=cnt1[x],说明原来是不等的,现在加了x后相等了,所以diff-1。
对于y是相同的。
可以用cnt[x] = cnt2[x]-cnt1[x]来表示对应字符个数,这样就把cnt1[x]与cnt2[x]的比较转化为cnt[x]与0的比较 - 双指针法。与优化部分相反,在保证cnt的值不为正的情况下,考察一个区间长度是否与s1长度相同。原始cnt元素都不大于零,和为-len1,当区间left~right right每右移一次,cnt元素之和就加一,当区间长度为n时,cnt元素之和为0,并且cnt元素小于等于0,所以这个时候cnt元素均为零。
为什么要保证cnt的值不为正呢?因为右指针右移一位,就会加进来一个字符x,cnt[x]就会加一,如果字符串s1中有x字符,加一后cnt[x]>0,说明s2[left~right]中x字符比s1中x字符多,所以就得舍弃这个区间;如果s1中没有x字符,加一后cnt[x]>0,说明s2[left right]区间中存在s1中不存在的字符x,同理要舍弃这个区间。
怎么舍弃这个区间呢?右指针右移,相当于把指向过的元素添加到[left~right]区间中,左值针右移,相当于把指向过的元素从[left right]中删除掉。当某个cnt[x]>0时,一直右移左值针,直到cnt[x]不大于0,这个过程相当于把添加到[left right]的元素删除掉,把cnt恢复到原来的样子。这时候左右指针同起点,都指向字符x。
- 代码
滑动固定窗口
class Solution {
public:
bool checkInclusion(string s1, string s2) {
int len1 = s1.size();
int len2 = s2.size();
if(len1>len2) return false;
vector<int> cnt1(26),cnt2(26);
for(int i = 0;i<len1;++i){
++cnt1[s1[i]-'a'];
++cnt2[s2[i]-'a'];
}
if(cnt1 == cnt2) return true;
for(int i = len1;i<len2;++i){
++cnt2[s2[i]-'a'];
--cnt2[s2[i-len1]-'a'];
if(cnt1 == cnt2) return true;
}
return false;
}
};
优化:
class Solution {
public:
bool checkInclusion(string s1, string s2) {
int len1 = s1.size();
int len2 = s2.size();
int diff = 0;
if(len1>len2) return false;
vector<int> cnt(26);
for(int i = 0;i<len1;++i){
--cnt[s1[i]-'a'];
++cnt[s2[i]-'a'];
}
for(int k:cnt){
if(k!=0) ++diff;
}
if(diff == 0) return true;
for(int i = len1;i<len2;++i){
int x = s2[i]-'a',y = s2[i-len1]-'a';
if(x == y) continue;
//表示先判断原来x对应的字符在s1和s2子字符串中的个数是否已经相同,那么diff++
if(cnt[x]==0) ++diff;
++cnt[x];//新添加的x字符对应数组中++
//添加之后x字符对应数组元素为零,表示对应字符数量相同diff--
if(cnt[x]==0) --diff;
if(cnt[y]==0) ++diff;
--cnt[y];
if(cnt[y]==0) --diff;
if(diff == 0) return true;
}
return false;
}
};
class Solution {
public:
bool checkInclusion(string s1, string s2) {
int len1 = s1.size();
int len2 = s2.size();
if(len1>len2) return false;
vector<int> cnt(26);
for(int i = 0;i<len1;++i){
--cnt[s1[i]-'a'];
}
int left = 0;
for(int right = 0;right<len2;++right){
int x = s2[right]-'a';
++cnt[x];
while(cnt[x]>0){
--cnt[s2[left]-'a'];
++left;
}
if(right-left+1==len1) return true;
}
return false;
}
};
- 总结学习
-
由于排列不会改变字符串中每个字符的个数,所以只有当两个字符串每个字符的个数均相等时,一个字符串才是另一个字符串的排列。可以用来判断某个字符串的排列
-
用数组表示某个字符的数目,不一定非得是hash表:
vector<int> cnt(26);++cnt[x-'a'];
如果我知道这两条,这到题的第一种方法就可以写出来。 -
从优化部分可以学到当两个对象进行比较时,可以转化为让他们做差后与零比较。
-
固定窗口好理解,窗口长度固定,看看是否匹配就行。
-
不定长窗口,还没想通