leetcode 30 串联所有单词的子串

最新推荐文章于 2024-04-01 11:20:13 发布

nobrody

最新推荐文章于 2024-04-01 11:20:13 发布

阅读量121

点赞数

本文链接：https://blog.csdn.net/zshluckydogs/article/details/107217789

版权

题目描述

给定一个字符串 s 和一些长度相同的单词 words。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。

注意子串要与 words 中的单词完全匹配，中间不能有其他字符，但不需要考虑 words 中单词串联的顺序。

示例 1：

输入：
s = "barfoothefoobarman",
words = ["foo","bar"]
输出：[0,9]
解释：
从索引 0 和 9 开始的子串分别是 "barfoo" 和 "foobar" 。
输出的顺序不重要, [9,0] 也是有效答案。
示例 2：

输入：
s = "wordgoodgoodgoodbestword",
words = ["word","good","best","word"]
输出：[]

解题思路

有两个要点，一是words中单词的长度相同，二是words中单词可以任意顺序组合。

进一步想到，words中任意一个组合的长度都是确定的：n*m n是单词总数，m是单个单词的长度。

再进一步，s中字符的顺序是确定的，所以s最多有len(s)-n*m+1个n*m长度的字符组合

显然，可以通过对s进行长度为n*m的滑窗，然后判断改字符组合是否在words中所有组合中

方法一

直接递归，判断s的长度为m*n的长度中每一个m是否在words中。

1、s切片，长度n*m

2、判断切片前m个字符是否在words中，是进行第3步，否返回false

3、判断切片剩下的字符，从words中移除切片的前m个元素。

class Solution:
    def findSubstring(self, s: str, words: List[str]) -> List[int]:
        
        # s 和 words中只要有一个为空，直接返回空。
        # 字符串的切片，以及列表的in判断比较耗时，
        # 后续可以利用字典的in判断取代列表的in判断
        # 以及优化字符串的切片操作进行加速。
        if not s or not words:
            return []
        res = []
        m,n = len(words),len(words[0])
        #words = set(words)
        def dfs(s, words):
            if len(words)==1 and s in words:
                return True
            if s[:n] not in words:
                return False

            words.remove(s[:n])
            return dfs(s[n:],words)
        for i in range(len(s)-m*n+1):
            if dfs(s[i:i+m*n],copy.deepcopy(words)):
                res.append(i)
        return res

方法二

换一种思路，统计s的长度为n*m的切片中长度为m的字符组合的数目，如果这个数目和words中长度为m的word的数目相同，则是成功的匹配。利用Counter方法。

class Solution:
    def findSubstring(self, s: str, words: List[str]) -> List[int]:

        from collections import Counter 
        if not s or not words:return []
        word_lenth=len(words[0])
        word_num=len(words)
        all_lenth=word_lenth*word_num
        harsh=Counter(words)
        n=len(s)
        index=[]
        for i in range(0,n-all_lenth+1):
            a=[]
            for j in range(i,i+all_lenth,word_lenth):
                a.append(s[j:j+word_lenth])
            res=Counter(a)
            if res==harsh:
                index.append(i)
        return index