题目
给定一个字符串 s 和一些长度相同的单词 words。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。
注意子串要与 words 中的单词完全匹配,中间不能有其他字符,但不需要考虑 words 中单词串联的顺序。
示例 1:
输入:
s = "barfoothefoobarman",
words = ["foo","bar"]
输出:[0,9]
解释:
从索引 0 和 9 开始的子串分别是 "barfoo" 和 "foobar" 。
输出的顺序不重要, [9,0] 也是有效答案。
示例 2:
输入:
s = "wordgoodgoodgoodbestword",
words = ["word","good","best","word"]
输出:[]
思路
这道题最开始的思路是
K
M
P
KMP
KMP,改进前的kmp只能匹配一次,所以将其改为多次匹配,但后来提交发现,给的目标串数组情况比较复杂,例如 s
中连续出现多次匹配,或者 words[]
中出现相同子串,处理这些情况会使代码逻辑变得复杂,后来看了别人的解题思路,想到了滑动窗口的方法;
滑动窗口:,匹配成功的子串长度一定等于目标串数组总长度之和,因此可以将窗口设置为这个值,对于窗口内的的子串,我们需要的使精准匹配,即每一次遍历,若匹配成功则继续匹配,匹配失败则退出当前循环,为了简化匹配的实现,我们将 words[]
存在 map
中,map
对应的 value
值为单词出现的次数,每一次匹配,value
值减一,若 value
值为负数,则匹配失败,具体见代码:
代码
import java.util.*;
import java.util.stream.Collectors;
class Solution {
public List<Integer> findSubstring(String s, String[] words) {
List<Integer> ans = new ArrayList<>();
if (s.length() == 0 || words.length == 0)
return ans;
int len = 0;
List<Integer> lenDiff = new ArrayList<>();
Map<String, Integer> source = new HashMap<>();
for (String word : words) {
int t = 1, l = word.length();
if (source.containsKey(word))
t += source.get(word);
source.put(word, t);
len += l;
lenDiff.add(l);
}
lenDiff = lenDiff.stream().distinct().collect(Collectors.toList());
for (int i=0; i<=s.length()-len; i++){
boolean flag = true;
Map<String, Integer> sourceCopy = new HashMap<>(source);
for (int j=i; j<i+len; ){
int k = 0;
for (; k<lenDiff.size(); k++) {
String key = s.substring(j, j+ lenDiff.get(k));
if (sourceCopy.containsKey(key)){
if (sourceCopy.get(key) > 0)
sourceCopy.put(key, sourceCopy.get(key)-1);
else
k = lenDiff.size();
break;
}
}
if (k < lenDiff.size())
j += lenDiff.get(k);
else {
flag = false;
break;
}
}
if (flag)
ans.add(i);
}
return ans;
}
public static void main(String[] args) {
Solution solution = new Solution();
String s = "";
String[] words = {};
System.out.println(solution.findSubstring(s, words));
}
}