30. 串联所有单词的子串
原始题目链接:https://leetcode.cn/problems/substring-with-concatenation-of-all-words/
给定一个字符串 s 和一些 长度相同 的单词 words 。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。
注意子串要与 words 中的单词完全匹配,中间不能有其他字符 ,但不需要考虑 words 中单词串联的顺序。
示例 1:
输入:s = “barfoothefoobarman”, words = [“foo”,“bar”]
输出:[0,9]
解释:
从索引 0 和 9 开始的子串分别是 “barfoo” 和 “foobar” 。
输出的顺序不重要, [9,0] 也是有效答案。
示例 2:
输入:s = “wordgoodgoodgoodbestword”, words = [“word”,“good”,“best”,“word”]
输出:[]
示例 3:
输入:s = “barfoofoobarthefoobarman”, words = [“bar”,“foo”,“the”]
输出:[6,9,12]
解题思路:
在s中以窗口大小开始查找words的单词是否都包含在内,是连续的并且都用完。
代码实现:
class Solution:
def findSubstring(self, s: str, words: List[str]) -> List[int]:
# 统计words里的单词及其个数
words_dict = {}
for word in words:
words_dict[word] = words_dict.get(word, 0) + 1
# words的单词长度,题目说明是每个单词长度是一样的
word_len = len(words[0])
# 窗口长度:单词个数 * 单词长度
windows_len = len(words) * word_len
# 给定的字符串长度
s_len = len(s)
ans = []
# 以窗口的大小为单位,在字符串s中查找,i是每个窗口的起点
for i in range(s_len - windows_len + 1):
# 每次都要用到统计的字典,并且需要减掉个数验证是否满足题目要求
# 所以用words_dict的浅复制,循环使用,等号是引用指向同一个内存地址
# deepcopy是深复制,父对象独立,子对象不变,并且需要导入import copy
temp_dict = words_dict.copy()
# j是每个窗口一个单词的终点
j = i + word_len
# 如果s中的字符串找到了words中的一个单词,并且字典中的计数还大于0的话(表示还没用完)
while s[j - word_len : j] in temp_dict and temp_dict[s[j - word_len : j]] > 0:
# 当前用过的单词的计数减1
temp_dict[s[j - word_len : j]] -= 1
# 开始下一个单词位置
j += word_len
# 如果以i为起点并且窗口内的单词都在words_dict中,那么符合条件
if sum(temp_dict.values()) == 0:
ans.append(i)
return ans
参考文献:
https://leetcode.cn/problems/substring-with-concatenation-of-all-words/solution/san-chong-fang-fa-zhu-jian-you-hua-by-hardcandy/