LeetCode 30 Substring with Concatenation of All Words

最新推荐文章于 2021-01-05 17:33:28 发布

HouseFangFZC

最新推荐文章于 2021-01-05 17:33:28 发布

阅读量236

点赞数

分类专栏： LeetCode 杂题文章标签： LeetCode 杂题

本文链接：https://blog.csdn.net/houserabbit/article/details/54783223

版权

LeetCode 同时被 2 个专栏收录

69 篇文章 0 订阅

订阅专栏

杂题

67 篇文章 0 订阅

订阅专栏

题意：

给出字符串s和许多等长(len)单词w，找出所有s中的满足子串为w中所有单词的一种组合的位置。

思路：

因为w中的单词要满足的是组合而不是排列，因此用“区间[L,R]中包含单词的计数”来维护比较合适。

一是满足了组合对顺序的不要求，二是方便处理重复的单词。

首先可以统计一下，w中各种单词个数。如果s的长度为size(w) * len的子串单词计数与w相同，则找到一个答案。

接着去s中找到所有w中单词出现的位置，因为单词等长，所以可以开一个长度为size(s)的数组A，A[i]记录着从i位置开始长度为len的s的子串对应哪个单词。

然后枚举区间[L,R]判断是否为答案。可以这样做，L起始位置枚举[0, len - 1]，初始R与L相同表示空队列，接着R端每次入队一个len长度的s的子串，如果队列长度超过size(w) * len则队首出队，再检查队列中字符串的计数，如果与w相同，则记录答案。这里还有一个维护技巧，为了避免对应单词的计数的比较，可以维护队列中单词的计数一定小于w中计数，方法就是一旦队列中某单词x计数多了，那么L不断右移len个单位，直到x计数满足条件为止。

最后将答案返回。

代码：

class Solution {
public:
    vector<int> findSubstring(string s, vector <string> &words) {
        vector<int> ans;
        ans.clear();

        if (words.size() == 0) {
            return ans;
        }

        map<string, int> hash;
        hash.clear();
        for (int i = 0, idx = 0; i < words.size(); ++i) {
            if (!hash.count(words[i])) {
                hash[words[i]] = idx++;
            }
        }

        int *cnt = new int[hash.size()];
        memset(cnt, 0, sizeof(int) * hash.size());
        for (int i = 0, idx = 0; i < words.size(); ++i) {
            ++cnt[hash[words[i]]];
        }

        int *start = new int[s.size()];
        memset(start, -1, sizeof(int) * s.size());
        for (auto i = hash.begin(); i != hash.end(); ++i) {
            for (int idx = -1; idx + 1 < s.size();) {
                idx = s.find(i->first, idx + 1);
                if (idx != -1) {
                    start[idx] = i->second;
                } else {
                    break;
                }
            }
        }

        int len = words[0].size();
        for (int i = 0; i < len; ++i) {
            int tmpcnt = 0;
            int k = i;
            for (int j = i; j + len <= s.size(); j += len) {
                if ((j - k) / len == words.size()) {
                    if (start[k] != -1) {
                        --tmpcnt;
                        ++cnt[start[k]];
                    }
                    k += len;
                }
                if (start[j] != -1) {
                    --cnt[start[j]];
                    ++tmpcnt;
                    while (cnt[start[j]] < 0) {
                        if (start[k] != -1) {
                            --tmpcnt;
                            ++cnt[start[k]];
                        }
                        k += len;
                    }
                    if (tmpcnt == words.size()) {
                        ans.push_back(j - (tmpcnt - 1) * len);
                    }
                }
            }
            for (; k + len <= s.size(); k += len) {
                if (start[k] != -1) {
                    ++cnt[start[k]];
                }
            }
        }

        sort(ans.begin(), ans.end());
        return ans;
    }
};