LC 76.最小覆盖子串

最小覆盖子串

76. 最小覆盖子串 - 力扣(LeetCode)

给你一个字符串 s 、一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串,则返回空字符串 ""

注意:

  • 对于 t 中重复字符,我们寻找的子字符串中该字符数量必须不少于 t 中该字符数量。
  • 如果 s 中存在这样的子串,我们保证它是唯一的答案。

示例 1:

输入:s = "ADOBECODEBANC", t = "ABC"
输出:"BANC"
解释:最小覆盖子串 "BANC" 包含来自字符串 t 的 'A'、'B' 和 'C'。

示例 2:

输入:s = "a", t = "a"
输出:"a"
解释:整个字符串 s 是最小覆盖子串。

示例 3:

输入: s = "a", t = "aa"
输出: ""
解释: t 中两个字符 'a' 均应包含在 s 的子串中,
因此没有符合条件的子字符串,返回空字符串。

提示:

  • m == s.length
  • n == t.length
  • 1 <= m, n <= 10^5
  • st 由英文字母组成

**进阶:**你能设计一个在 o(m+n) 时间内解决此问题的算法吗?

解题

解法一(滑动窗口)

思路分析:

  1. 考虑暴力解法会超时,可以使用滑动窗口来解决,通过移动窗口右边界,寻找包含字符串ts子串,当找到覆盖t的子串时,再移动左边界,将子串长度减小,直到为覆盖字符串t的最小长度。

  2. 对于窗口区间确认为[left, right),即子串长度为right-left,同时重点需要考虑的是:如何确认s的子串是否已经覆盖了字符串t,先将字符串t包含的字符及其数量进行统计,使用数组tNum进行统计,然后在寻找字串的过程中逐步统计子串中包含的字符及其数量,使用数组sWin进行统计。

  3. 若直接使用统计的子串字符及数量和t的统计进行对比,也需要进行遍历对比,对时间消耗很大,因此使用一个变量distance来确认子串是否已经包含了t中的字符:

    1. 在移动右边界,当子串增加了一个在t中的字符时,则令distance++,直到在子串中该字符的数目已经等于或大于在t中的字符数目时,该字符不再令dishtance增加。
    2. 因此当distance == t.length()时,则说明子串已经覆盖了字符串t
    3. 此时移动左边界,当左边界排除了一个在t中的字符时,若排除该字符前,子串中该字符数目等于t中该字符数目时,即sWin[s.charAt(left)] == tNum[s.charAt(left)],该字符被排除,说明子串不再完全包含字符串t中字符,令distance--
  4. 使用minLen来记录最小子串长度,使用begin来记录最小子串的起始索引,若minLen等于初始值,则说明不存在子串满足条件,返回空字符串,否则则将满足条件的子串返回。

实现代码如下:

class Solution {
    public String minWindow(String s, String t) {
       int sLen = s.length();    // 获取字符串s的长度
       int tLen = t.length();    // 获取字符串t的长度
       int[] sWin = new int[128];    // 记录字符串s的字符频数
       int[] tNum = new int[128];    // 记录字符串t的字符频数
       // 将字符串转化为字符数组
       char[] sCharArray = s.toCharArray();
       // 对 t 中的字符数目 进行统计
       for (int i = 0; i < tLen; ++i) {
          tNum[t.charAt(i)] ++;
       }
       // 定义窗口左右端点
       int left = 0;
       int right = 0;
       // 记录s最小子串的长度
       int minLen = Integer.MAX_VALUE;
       // 记录s最小子串的起始索引
       int begin = 0;
       int distance = 0;     // 用于统计s的子串包含多少字符串t中的字符
       // 定义区间为 [left, right)
       while (right < sLen) {
          char chR = sCharArray[right];
          if (tNum[chR] == 0) {  // 当右边界字符不在字符串t中时 直接继续添加下一位字符
             // 该判断可省略
             // 当移动左边界时 可将该字符排除
             right++;
             continue;
          }
          if (sWin[chR] < tNum[chR]) {
             // 当子串中包含该字符数少于字符串t时
             // 即子串保存t中字符数加一
             distance++;
          }
          sWin[chR]++; // 统计该字符
          right ++;   // 移动右指针 保证窗口区间为 [left, right)
          while (distance == tLen) { // 当s的子串包含字符串t的所有字符时 左边界开始移动
             // 此时窗口区间为[left, right) 则窗口长度为 right-left
             if (right -left < minLen) {
                minLen = right - left;
                begin = left;
             }
             char chL = sCharArray[left];
             if (tNum[chL] == 0) {
                // 字符串t不包含该字符 直接移动
                // 该判断可省略 与右边界移动循环判断处对应
                left ++;
                continue;
             }
             if (sWin[chL] == tNum[chL]) {
                distance --;   // 左边界移动导致子串不再完全包含字符串t中的字符
             }
             sWin[chL] --;  // 排除该字符
             left ++;   // 移动左边界
          }
       }
       if (minLen == Integer.MAX_VALUE)
          return "";    // 若minLen未发生改变 则没有符合条件的子串
       return s.substring(begin, begin+minLen);
    }
}

提交结果如下:

解答成功:
	执行耗时:2 ms,击败了99.00% 的Java用户
	内存消耗:43 MB,击败了64.23% 的Java用户

复杂度分析:

  • 时间复杂度分析:O(|S| + |T|),首先需要遍历字符串t,统计其中字符及数量,然后窗口左右边界最极端情况下需要各自遍历一遍,同时将字符串s转换为字符串数组,函数内部需要遍历一次。

  • 空间复杂度分析:O(|S| + |T|)

优化(+哈希表)

优化思路:

  1. 首先考虑字符频数数组,我们可以使用哈希表来统计字符频数,可以省略部分时间和空间,
  2. 同时可以省略一些判断,让代码更加简洁,但是这会增加对于哈希表的操作(此处未省略)

实现代码如下:

class Solution {
    public String minWindow(String s, String t) {
       int sLen = s.length();    // 字符串s的长度
       int tLen = t.length();        // 字符串t的长度
       HashMap<Character, Integer> tHash = new HashMap<>();   // 记录字符串t的字符频数
       HashMap<Character, Integer> sHash = new HashMap<>();   // 记录字符串s的字符频数
       // 先对字符t进行统计
       for (int i = 0; i < tLen; ++i) {
          char ch = t.charAt(i);
          tHash.put(ch, tHash.getOrDefault(ch, 0) + 1);
       }
       int left = 0;  // 定义窗口左边界
       int minLen = Integer.MAX_VALUE;       // 用于记录更新最小子串长度
       int begin = 0;    // 记录最小子串起始索引
       int distance = 0;  // 记录子串包含字符串t字符的字符数
       // 使用for循环代替while 更简洁 但是需要注意窗口区间 变化
       for (int right = 0; right < sLen; ++right) {
          char chR = s.charAt(right);
          if (!tHash.containsKey(chR))
             continue;  // 可以减少很多不必要的比较和操作
          if (sHash.getOrDefault(chR, 0) < tHash.get(chR)) {
             ++ distance;
          }
          sHash.put(chR, sHash.getOrDefault(chR, 0) + 1);
          while (distance == tLen) {
             // 此时窗口区间为[left, right]
             if (right-left+1 < minLen) {
                minLen = right - left + 1;
                begin = left;
             }
             char chL = s.charAt(left);
             if (!tHash.containsKey(chL)) { // 若字符不在t中 则跳过记录到哈希中的步骤
                left ++;
                continue;
             }
             if (sHash.getOrDefault(chL, 0).equals(tHash.get(chL))) {
                // 注意此处判断不能使用 ==
                // 因为Integer引用类型变量   ==比较的是引用而非内容
                -- distance;
             }
             sHash.put(chL, sHash.getOrDefault(chL, 0) - 1);
             left ++;
          }
       }
       if (minLen == Integer.MAX_VALUE) return "";
       return s.substring(begin, begin+minLen);
    }
}

提交结果如下:

解答成功:
	执行耗时:13 ms,击败了70.19% 的Java用户
	内存消耗:43.6 MB,击败了13.80% 的Java用户

总结:

对于一个字符串是否包含另外一个字符串,在不需要考虑字符之间顺序的情况下,可以使用一个变量distance来记录,每当子串中多一个属于t的字符,让distance+1,当distance == t.length()时,即说明此时已包含字符串t,当然对于distance的增加,也需要考虑每个字符对应的数量,相等时不用再让distance+1,但仍需记录下该字符的数目,即sWin[chR]++,便于将该字符排除时不会误判。

  • 27
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值