我们的口号是:使用最简洁的代码,完成AC:)
题目说明
给定一个字符串 s 和一些长度相同的单词 words。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。
注意子串要与 words 中的单词完全匹配,中间不能有其他字符,但不需要考虑 words 中单词串联的顺序。
示例 1:
输入: s = “barfoothefoobarman”, words = [“foo”,“bar”]
输出:[0,9]
解释:从索引 0 和 9 开始的子串分别是 “barfoo” 和 “foobar” 。 输出的顺序不重要, [9,0] 也是有效答案。
示例 2:
输入: s = “wordgoodgoodgoodbestword”, words =[“word”,“good”,“best”,“word”]
输出:[]
题目分析
阅读题目,字符串s和单词集合words需要完全匹配,很自然就可以想到使用hash表。
但在使用过程中需格外注意的是可能会存在单词错位问题,比如:
s为baaade,words为[‘baa’, ’aad’],words中的每一个单词都在s中,words的长度和等于s,但是使用words匹配s时,会产生下标重合,此时输出应该为[]。
因此,在一一匹配时需要额外注意下标不可重合,由于words内的每一个单词长度都相同,通过遍历得到一个临时tmp_words,若tmp_words与输入的words容器内单词一致,即完全匹配。
python代码
class Solution:
def findSubstring(self, s: str, words: List[str]) -> List[int]:
if s == ‘’ or words == []:
return []
n = len(s)
all_len = sum(map(len, words))
one_len = len(words[0])
from collections import Counter
words = Counter(words)
for i in range(0, n - all_len + 1):
tmp = s[i:i+all_len]
tmp_words = []
for j in range(0, all_len, one_len):
if tmp[j:j+one_len] in words:
tmp_words.append(tmp[j:j+one_len])
tmp_words = Counter(tmp_words)
if tmp_words == words:
res.append(i)
return res
如果有疑问欢迎留言,我看到后会回复哒:)