给你一个字符串 S、一个字符串 T 。请你设计一种算法,可以在 O(n) 的时间复杂度内,从字符串 S 里面找出:包含 T 所有字符的最小子串。
示例:
输入:S = "ADOBECODEBANC", T = "ABC"
输出:"BANC"
提示:
如果 S 中不存这样的子串,则返回空字符串 “”。
如果 S 中存在这样的子串,我们保证它是唯一的答案。
这个题目是典型的滑动窗口问题,大致的公式如下:
int left = 0, right = 0;
while (right < s.size()) {`
// 增大窗口
window.add(s[right]);
right++;
while (window needs shrink) {
// 缩小窗口
window.remove(s[left]);
left++;
}
}
这个算法技巧的时间复杂度是 O(N),比字符串暴力算法要高效得多。
其实困扰大家的,不是算法的思路,而是各种细节问题。比如说如何向窗口中添加新元素,如何缩小窗口,在窗口滑动的哪个阶段更新结果。
滑动窗口算法的思路是这样:
1、我们在字符串 S 中使用双指针中的左右指针技巧,初始化 left = right = 0,把索引左闭右开区间 [left, right) 称为一个「窗口」。
2、我们先不断地增加 right 指针扩大窗口 [left, right),直到窗口中的字符串符合要求(包含了 T 中的所有字符)。
3、此时,我们停止增加 right,转而不断增加 left 指针缩小窗口 [left, right),直到窗口中的字符串不再符合要求(不包含 T 中的所有字符了)。同时,每次增加 left,我们都要更新一轮结果。
4、重复第 2 和第 3 步,直到 right 到达字符串 S 的尽头。
这个思路其实也不难,**第 2 步相当于在寻找一个「可行解」,然后第 3 步在优化这个「可行解」,最终找到最优解,**也就是最短的覆盖子串。左右指针轮流前进,窗口大小增增减减,窗口不断向右滑动,这就是「滑动窗口」这个名字的来历。
1)needs 和 window 相当于计数器,分别记录 T 中字符出现次数和「窗口」中的相应字符的出现次数。
2)增加 right,直到窗口 [left, right] 包含了 T 中所有字符
3)增加 right,直到窗口 [left, right] 包含了 T 中所有字符
4)直到窗口中的字符串不再符合要求,left 不再继续移动
具体流程如下:
首先,初始化 window 和 need 两个哈希表,记录窗口中的字符和需要凑齐的字符:
HashMap<Character,Integer> need = new HashMap<Character,Integer>();
HashMap<Character,Integer> window = new HashMap<Character,Integer>();
然后,使用 left 和 right 变量初始化窗口的两端,不要忘了,区间 [left, right) 是左闭右开的,所以初始情况下窗口没有包含任何元素:
int len = Integer.MAX_VALUE;
int left = 0;
int right = 0;
int valid = 0;
while(right<s.length()){
// 开始滑动
}
其中 valid 变量表示窗口中满足 need 条件的字符个数,如果 valid 和 need.size 的大小相同,则说明窗口已满足条件,已经完全覆盖了串 T。
现在开始套模板,只需要思考以下四个问题:
1、当移动 right 扩大窗口,即加入字符时,应该更新哪些数据?
2、什么条件下,窗口应该暂停扩大,开始移动 left 缩小窗口?
3、当移动 left 缩小窗口,即移出字符时,应该更新哪些数据?
4、我们要的结果应该在扩大窗口时还是缩小窗口时进行更新?
如果一个字符进入窗口,应该增加 window 计数器;如果一个字符将移出窗口的时候,应该减少 window 计数器;当 valid 满足 need 时应该收缩窗口;应该在收缩窗口的时候更新最终结果。
class Solution {
public String minWindow(String s, String t) {
HashMap<Character,Integer> need = new HashMap<Character,Integer>();
HashMap<Character,Integer> window = new HashMap<Character,Integer>();
int start=0;
int len = Integer.MAX_VALUE;
int left = 0;
int right = 0;
int valid = 0;
for(int i=0;i<t.length();i++){
char t1 = t.charAt(i);
need.put(t1,need.getOrDefault(t1,0)+1);
}
while(right<s.length()){
char s1 = s.charAt(right);
if(need.containsKey(s1)){
window.put(s1,window.getOrDefault(s1,0)+1);
if(window.get(s1)==need.get(s1)){
valid++;
}
}
right++;
while(valid==need.size()){
if(right-left<len){
len = right - left;
start = left;
}
char s2 = s.charAt(left);
if(need.containsKey(s2)){
if(window.get(s2)==need.get(s2)){
valid--;
}
window.put(s2,window.getOrDefault(s2,0)-1);
}
left++;
}
}
return len == Integer.MAX_VALUE?"":s.substring(start,start+len);
}
}
需要注意的是,当我们发现某个字符在 window 的数量满足了 need 的需要,就要更新 valid,表示有一个字符已经满足要求。而且,你能发现,两次对窗口内数据的更新操作是完全对称的。
当 valid == need.size() 时,说明 T 中所有字符已经被覆盖,已经得到一个可行的覆盖子串,现在应该开始收缩窗口了,以便得到「最小覆盖子串」。
移动 left 收缩窗口时,窗口内的字符都是可行解,所以应该在收缩窗口的阶段进行最小覆盖子串的更新,以便从可行解中找到长度最短的最终结果。