LeetCode——串联所有单词的子串 / 无重复字符的最长子串

最新推荐文章于 2022-08-24 12:34:01 发布

Yawn__

最新推荐文章于 2022-08-24 12:34:01 发布

阅读量194

点赞数 1

分类专栏： LeetCode

本文链接：https://blog.csdn.net/ly0724ok/article/details/117336199

版权

LeetCode 专栏收录该内容

198 篇文章 9 订阅

订阅专栏

1. 串联所有单词的子串

给定一个字符串 s 和一些长度相同的单词 words 。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。

注意子串要与 words 中的单词完全匹配，中间不能有其他字符，但不需要考虑 words 中单词串联的顺序。

示例 1：

输入：s = “barfoothefoobarman”, words = [“foo”,“bar”]
输出：[0,9]
解释：
从索引 0 和 9 开始的子串分别是 “barfoo” 和 “foobar” 。
输出的顺序不重要, [9,0] 也是有效答案。

示例 2：

输入：s = “wordgoodgoodgoodbestword”, words = [“word”,“good”,“best”,“word”]
输出：[]

示例 3：

输入：s = “barfoofoobarthefoobarman”, words = [“bar”,“foo”,“the”]
输出：[6,9,12]

提示：

1 <= s.length <= 104
s 由小写英文字母组成
1 <= words.length <= 5000
1 <= words[i].length <= 30
words[i] 由小写英文字母组成

（1）直接法

借用Hashmap，利用两个HashMap
一个HashMap,map1存储words中：单词/单词出现次数（key为单词，value为单词出现次数）。
一个HashMap,map2用于从s中截取所有words串联的字符串
将以上从s中截取所有words串联的字符串按照单个word长度进行拆分
比较map1与map2是否相等
因为遍历和比较都是线性的，所以时间复杂度：O(n^2)

class Solution {
    public List<Integer> findSubstring(String s, String[] words) {
        List<Integer> res = new ArrayList<>();
        if (s == null || s.length() == 0 || words.length == 0 || words == null)
            return res;
        
        HashMap<String, Integer> map = new HashMap<>();
        int one_word = words[0].length();       //单个word长度
        int word_num = words.length;            //word的个数
        int all_len = one_word * word_num;      //子串长度

        //存储单词words: key为单词，value为单词出现次数
        for (String word : words) {
            map.put(word, map.getOrDefault(word, 0) + 1);       
        }

        //截取所有单词串联的字符串
        for (int i = 0; i < s.length() - all_len + 1; i++) {
            //substring（x, y）:x, y分别为开始/结束位置，左闭右开，[ )
            String tmp = s.substring(i, i+all_len);
            HashMap<String,Integer> tmp_map = new HashMap<>();

            //所有单词串联的字符串，按照单个word长度拆分
            for(int j = 0; j < all_len; j += one_word) {
                String w = tmp.substring(j, j + one_word);
                //截取字符串出现次数，key为单词，value为单词出现次数
                tmp_map.put(w, tmp_map.getOrDefault(w, 0) + 1);
            }
            if (map.equals(tmp_map))
                res.add(i);
        }

        return res;
    }
}

（2）滑动窗口

在 s 维护着所有单词长度总和的一个长度队列

class Solution {
    public List<Integer> findSubstring(String s, String[] words) {
        List<Integer> res = new ArrayList<>();
        HashMap<String, Integer> wordsMap = new HashMap<>();
        int one_word = words[0].length();       //单个word长度
        int word_num = words.length;            //word的个数
        int all_len = one_word * word_num;      //子串长度

        //为空 和 子串 > 主串，直接返回
        if (s == null || s.length() == 0 || words.length == 0 || words == null)
            return res;
        if(all_len > s.length())
            return res;

        //存储单词words: key为单词，value为单词出现次数
        for (String word : words) {
            wordsMap.put(word, wordsMap.getOrDefault(word, 0) + 1);       
        }

        // 只讨论从0，1，...， oneLen-1 开始的子串情况，
        // 每次进行匹配的窗口大小为 wordsLen，每次后移一个单词长度，由左右窗口维持当前窗口位置
        for (int i = 0; i < one_word; i++) {
            int left = i, right = i, count = 0;
            Map<String, Integer> subMap = new HashMap<>();

            // 右窗口不能超出主串长度
            while (right + one_word <= s.length()) {
                String word = s.substring(right, right + one_word);       // 得到一个单词
                right += one_word;            // 有窗口右移

                // words[]中没有这个单词，那么当前窗口肯定匹配失败，直接右移到这个单词后面
                if (!wordsMap.containsKey(word)) {
                    left = right;
                    subMap.clear();         // 窗口内单词统计map清空，重新统计
                    count = 0;              // 符合要求的单词数清0
                } else {
                // 统计当前子串中这个单词出现的次数
                    subMap.put(word, subMap.getOrDefault(word, 0) + 1);
                    ++count;
                    // 如果这个单词出现的次数大于words[]中它对应的次数，又由于每次匹配和words长度相等的子串
                    // 如 ["foo","bar","foo","the"]  "| foobarfoobar| foothe"
                    // 第二个bar虽然是words[]中的单词，但是次数抄了，那么右移一个单词长度后 "|barfoobarfoo|the"
                    // bar还是不符合，所以直接从这个不符合的bar之后开始匹配，也就是将这个不符合的bar和它之前的单词(串)全移出去
                    while (subMap.getOrDefault(word, 0) > wordsMap.getOrDefault(word, 0)) {
                        // 从当前窗口字符统计map中删除从左窗口开始到数量超限的所有单词(次数减一)
                        String w = s.substring(left, left + one_word);
                        subMap.put(w, subMap.getOrDefault(w, 0) - 1);
                        --count;
                        left += one_word;
                    }
                     // 当前窗口字符串满足要求
                    if (count == words.length) 
                        res.add(left);
                }
            }     
        }
        return res;
    }
}

2. 无重复字符的最长子串

给定一个字符串，请你找出其中不含有重复字符的最长子串的长度。

示例 1:

输入: s = “abcabcbb”
输出: 3
解释: 因为无重复字符的最长子串是 “abc”，所以其长度为 3。

示例 2:

输入: s = “bbbbb”
输出: 1
解释: 因为无重复字符的最长子串是 “b”，所以其长度为 1。

示例 3:

输入: s = “pwwkew”
输出: 3
解释: 因为无重复字符的最长子串是 “wke”，所以其长度为 3。
请注意，你的答案必须是子串的长度，“pwke” 是一个子序列，不是子串。

示例 4:

输入: s = “”
输出: 0

提示：

0 <= s.length <= 5 * 104
s 由英文字母、数字、符号和空格组成

（1）暴力

不论使用哪种方法，都需要判断当前字符是否已经出现在当前子串中，如果不使用哈希表，则额外需要O(n)的时间复杂度。
因此以下方法都默认使用哈希表来判断是否出现了重复字符。

class Solution {
    public int lengthOfLongestSubstring(String s) {
		int res = 0;
		Set<Character>  set = new HashSet<>();
		char[] str = s.toCharArray();
		for (int i = 0; i < str.length; i++) {
			int curRes = 0;
			for (int j = i; j < str.length; j++) {
				//如果存在重复字符，直接返回
				if (set.contains(str[j])) {
					set.clear();
					break;
				} else {
					set.add(str[j]);
					curRes += 1;
				}
				//每次跳出循环时计算当前子串长度
				res = Math.max(res, curRes);
			}
		}
		return res;
    }
}

（2）滑动窗口

暴力解法时间复杂度较高，会达到 O(n^2)，故而采取滑动窗口的方法降低时间复杂度
定义一个 map 数据结构存储 (k, v)，其中 key 值为字符，value 值为字符位置 +1，加 1 表示从字符位置后一个才开始不重复
我们定义不重复子串的开始位置为 start，结束位置为 end
随着 end 不断遍历向后，会遇到与 [start, end] 区间内字符相同的情况，此时将字符作为 key 值，获取其 value 值，并更新 start，此时 [start, end] 区间内不存在重复字符
无论是否更新 start，都会更新其 map 数据结构和结果 ans。
时间复杂度：O(n)

class Solution {
    public int lengthOfLongestSubstring(String s) {
        int len = s.length();
        int max = 0;

        // map (k, v)，其中 key 值为字符，value 值为字符位置;
        Map<Character, Integer> map = new HashMap<>();  

        for (int start = 0, end = 0; end < len; end++) {
            char element = s.charAt(end);
            if (map.containsKey(element)) {
                //map.get(element)为第一次出现重复字符的位置
                //map.get()的地方进行+1操作,不加1则"abcabcbb"结果错误，本应3，输出4
                start = Math.max(map.get(element) + 1, start);
            }
            max = Math.max(max, end - start + 1);
            map.put(element, end);
        }
        return max;
    }
}

Yawn__

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
LeetCode——串联所有单词的子串 / 无重复字符的最长子串

1. 题目给定一个字符串 s 和一些长度相同的单词 words 。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。注意子串要与 words 中的单词完全匹配，中间不能有其他字符，但不需要考虑 words 中单词串联的顺序。示例 1：输入：s = “barfoothefoobarman”, words = [“foo”,“bar”]输出：[0,9]解释：从索引 0 和 9 开始的子串分别是 “barfoo” 和 “foobar” 。输出的顺序不重要, [9,0]
复制链接

扫一扫