[LeetCode] 30. 串联所有单词的子串(哈希表)

30. 串联所有单词的子串

给定一个字符串 s 和一些长度相同的单词 words。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。

注意子串要与 words 中的单词完全匹配,中间不能有其他字符,但不需要考虑 words 中单词串联的顺序。

在这里插入图片描述
解题思路: 先将题意转换一种说法,题目给定一组长度相同的单词,假设个数为n,长度为len,在字符串s中找一段长度为 n*len的子字符串,使得这个子字符串恰好由单词words组成,那么最自然的想法是,对字符串s每个长度为n*len的子字符串都进行判断,但是起点在len(s)-n*len之后的子字符串不用判断,因为长度不够(提前剪枝,降低时间复杂度),那么剩下的就是如何设计函数来判断子字符串是否恰好能由words串联而成,有两种方法:

  1. 由于字符串会重复,可以将words存在multiset中,然后在子字符串中以步进len截取子字符串,判断是否在multiset中,若存在则将multiset中这个字符串erase掉,否则,若不存在,则判断multiset是否为空了,为空说明已经找到串联的字符串;
  2. 或者不使用multiset而使用hashmap,对words词频进行统计,同样以步进len截取子字符串,若子字符串存在于hashmap中,则将hashmap减1,当hashmap对应项为0时,erase,若子字符串不存在于hashmap中,则判断hashmap是否为空,若为空,则表明已经找到串联的字符串。

最后提交OJ发现,方法1 TLE了,而方法2险过,看来方法1使用的rb-tree复杂度有点高,以后算法题中能用hash尽量用hash。不过方法2对应的整个算法,时间复杂度为 O ( n 2 ) O(n^2) O(n2),虽然网上有时间复杂度为O(n),但是凭现在的水平有点难以理解,还是本题算法好理解一点。

class Solution {
public:
    bool helper(string &s, int i, vector<string>& words) {
        int len = words[0].size();
        unordered_map<string, int> tmpcnt = wordsCnt;
        for (int j = i; j + len <= s.size(); j += len) {
            string tmp = s.substr(j, len);
            if (tmpcnt.count(tmp) == 0) {
                return tmpcnt.empty();
            }
            --tmpcnt[tmp];
            if (tmpcnt[tmp] == 0) tmpcnt.erase(tmp);
        }
        return tmpcnt.empty();
    }
    vector<int> findSubstring(string s, vector<string>& words) {
        if (s.empty() || words.empty() || words[0].empty())  return {};
        vector<int> res;
        for (auto &word : words) ++wordsCnt[word];
        int n = words.size(), len = words[0].size();
        for (int i = 0; i <= (int)s.size() - n * len; ++i) {
            if (helper(s, i, words)) {
                res.push_back(i);
            }
        }
        return res;
    }
private:
    unordered_map<string, int> wordsCnt;    
};

————————————

参考资料:

https://www.cnblogs.com/grandyang/p/4521224.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值