最小覆盖子串
给你一个字符串 s
、一个字符串 t
。返回 s
中涵盖 t
所有字符的最小子串。如果 s
中不存在涵盖 t
所有字符的子串,则返回空字符串 ""
。
注意:
- 对于
t
中重复字符,我们寻找的子字符串中该字符数量必须不少于t
中该字符数量。 - 如果
s
中存在这样的子串,我们保证它是唯一的答案。
示例 1:
输入:s = "ADOBECODEBANC", t = "ABC"
输出:"BANC"
解释:最小覆盖子串 "BANC" 包含来自字符串 t 的 'A'、'B' 和 'C'。
示例 2:
输入:s = "a", t = "a"
输出:"a"
解释:整个字符串 s 是最小覆盖子串。
示例 3:
输入: s = "a", t = "aa"
输出: ""
解释: t 中两个字符 'a' 均应包含在 s 的子串中,
因此没有符合条件的子字符串,返回空字符串。
提示:
m == s.length
n == t.length
1 <= m, n <= 10^5
s
和t
由英文字母组成
**进阶:**你能设计一个在 o(m+n)
时间内解决此问题的算法吗?
解题
解法一(滑动窗口)
思路分析:
-
考虑暴力解法会超时,可以使用滑动窗口来解决,通过移动窗口右边界,寻找包含字符串
t
的s
子串,当找到覆盖t
的子串时,再移动左边界,将子串长度减小,直到为覆盖字符串t
的最小长度。 -
对于窗口区间确认为
[left, right)
,即子串长度为right-left
,同时重点需要考虑的是:如何确认s
的子串是否已经覆盖了字符串t
,先将字符串t
包含的字符及其数量进行统计,使用数组tNum
进行统计,然后在寻找字串的过程中逐步统计子串中包含的字符及其数量,使用数组sWin
进行统计。 -
若直接使用统计的子串字符及数量和
t
的统计进行对比,也需要进行遍历对比,对时间消耗很大,因此使用一个变量distance
来确认子串是否已经包含了t
中的字符:- 在移动右边界,当子串增加了一个在
t
中的字符时,则令distance++
,直到在子串中该字符的数目已经等于或大于在t
中的字符数目时,该字符不再令dishtance
增加。 - 因此当
distance == t.length()
时,则说明子串已经覆盖了字符串t
- 此时移动左边界,当左边界排除了一个在
t
中的字符时,若排除该字符前,子串中该字符数目等于t
中该字符数目时,即sWin[s.charAt(left)] == tNum[s.charAt(left)]
,该字符被排除,说明子串不再完全包含字符串t
中字符,令distance--
- 在移动右边界,当子串增加了一个在
-
使用
minLen
来记录最小子串长度,使用begin
来记录最小子串的起始索引,若minLen
等于初始值,则说明不存在子串满足条件,返回空字符串,否则则将满足条件的子串返回。
实现代码如下:
class Solution {
public String minWindow(String s, String t) {
int sLen = s.length(); // 获取字符串s的长度
int tLen = t.length(); // 获取字符串t的长度
int[] sWin = new int[128]; // 记录字符串s的字符频数
int[] tNum = new int[128]; // 记录字符串t的字符频数
// 将字符串转化为字符数组
char[] sCharArray = s.toCharArray();
// 对 t 中的字符数目 进行统计
for (int i = 0; i < tLen; ++i) {
tNum[t.charAt(i)] ++;
}
// 定义窗口左右端点
int left = 0;
int right = 0;
// 记录s最小子串的长度
int minLen = Integer.MAX_VALUE;
// 记录s最小子串的起始索引
int begin = 0;
int distance = 0; // 用于统计s的子串包含多少字符串t中的字符
// 定义区间为 [left, right)
while (right < sLen) {
char chR = sCharArray[right];
if (tNum[chR] == 0) { // 当右边界字符不在字符串t中时 直接继续添加下一位字符
// 该判断可省略
// 当移动左边界时 可将该字符排除
right++;
continue;
}
if (sWin[chR] < tNum[chR]) {
// 当子串中包含该字符数少于字符串t时
// 即子串保存t中字符数加一
distance++;
}
sWin[chR]++; // 统计该字符
right ++; // 移动右指针 保证窗口区间为 [left, right)
while (distance == tLen) { // 当s的子串包含字符串t的所有字符时 左边界开始移动
// 此时窗口区间为[left, right) 则窗口长度为 right-left
if (right -left < minLen) {
minLen = right - left;
begin = left;
}
char chL = sCharArray[left];
if (tNum[chL] == 0) {
// 字符串t不包含该字符 直接移动
// 该判断可省略 与右边界移动循环判断处对应
left ++;
continue;
}
if (sWin[chL] == tNum[chL]) {
distance --; // 左边界移动导致子串不再完全包含字符串t中的字符
}
sWin[chL] --; // 排除该字符
left ++; // 移动左边界
}
}
if (minLen == Integer.MAX_VALUE)
return ""; // 若minLen未发生改变 则没有符合条件的子串
return s.substring(begin, begin+minLen);
}
}
提交结果如下:
解答成功:
执行耗时:2 ms,击败了99.00% 的Java用户
内存消耗:43 MB,击败了64.23% 的Java用户
复杂度分析:
-
时间复杂度分析:O(|S| + |T|),首先需要遍历字符串
t
,统计其中字符及数量,然后窗口左右边界最极端情况下需要各自遍历一遍,同时将字符串s
转换为字符串数组,函数内部需要遍历一次。 -
空间复杂度分析:O(|S| + |T|)
优化(+哈希表)
优化思路:
- 首先考虑字符频数数组,我们可以使用哈希表来统计字符频数,可以省略部分时间和空间,
- 同时可以省略一些判断,让代码更加简洁,但是这会增加对于哈希表的操作(此处未省略)
实现代码如下:
class Solution {
public String minWindow(String s, String t) {
int sLen = s.length(); // 字符串s的长度
int tLen = t.length(); // 字符串t的长度
HashMap<Character, Integer> tHash = new HashMap<>(); // 记录字符串t的字符频数
HashMap<Character, Integer> sHash = new HashMap<>(); // 记录字符串s的字符频数
// 先对字符t进行统计
for (int i = 0; i < tLen; ++i) {
char ch = t.charAt(i);
tHash.put(ch, tHash.getOrDefault(ch, 0) + 1);
}
int left = 0; // 定义窗口左边界
int minLen = Integer.MAX_VALUE; // 用于记录更新最小子串长度
int begin = 0; // 记录最小子串起始索引
int distance = 0; // 记录子串包含字符串t字符的字符数
// 使用for循环代替while 更简洁 但是需要注意窗口区间 变化
for (int right = 0; right < sLen; ++right) {
char chR = s.charAt(right);
if (!tHash.containsKey(chR))
continue; // 可以减少很多不必要的比较和操作
if (sHash.getOrDefault(chR, 0) < tHash.get(chR)) {
++ distance;
}
sHash.put(chR, sHash.getOrDefault(chR, 0) + 1);
while (distance == tLen) {
// 此时窗口区间为[left, right]
if (right-left+1 < minLen) {
minLen = right - left + 1;
begin = left;
}
char chL = s.charAt(left);
if (!tHash.containsKey(chL)) { // 若字符不在t中 则跳过记录到哈希中的步骤
left ++;
continue;
}
if (sHash.getOrDefault(chL, 0).equals(tHash.get(chL))) {
// 注意此处判断不能使用 ==
// 因为Integer引用类型变量 ==比较的是引用而非内容
-- distance;
}
sHash.put(chL, sHash.getOrDefault(chL, 0) - 1);
left ++;
}
}
if (minLen == Integer.MAX_VALUE) return "";
return s.substring(begin, begin+minLen);
}
}
提交结果如下:
解答成功:
执行耗时:13 ms,击败了70.19% 的Java用户
内存消耗:43.6 MB,击败了13.80% 的Java用户
总结:
对于一个字符串是否包含另外一个字符串,在不需要考虑字符之间顺序的情况下,可以使用一个变量distance
来记录,每当子串中多一个属于t
的字符,让distance+1
,当distance == t.length()
时,即说明此时已包含字符串t
,当然对于distance
的增加,也需要考虑每个字符对应的数量,相等时不用再让distance+1
,但仍需记录下该字符的数目,即sWin[chR]++
,便于将该字符排除时不会误判。