心情:想扁人,这道题花了我一下午的时间,时间主要花在:第一,没把题目的各种情况考虑周全;第二,由于之前一直在用C语言编程,对C++的STL忘记了,重新大致的复习了一遍。心情复杂,虽然做出来了,但是效率不高,有待优化,先记录一下大致思路。
题目描述:
给定一个字符串 s 和一些长度相同的单词 words。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。
注意子串要与 words 中的单词完全匹配,中间不能有其他字符,但不需要考虑 words 中单词串联的顺序。
示例 1:
输入:
s = “barfoothefoobarman”,
words = [“foo”,“bar”]
输出:[0,9]
解释:
从索引 0 和 9 开始的子串分别是 “barfoor” 和 “foobar” 。
输出的顺序不重要, [9,0] 也是有效答案。
示例 2:
输入:
s = “wordgoodgoodgoodbestword”,
words = [“word”,“good”,“best”,“word”]
输出:[]
思路过程:
一 注意点:
1.几种极端情况,为空的时候要考虑进去
2.words里面的字符串可能重复
3.直接暴力一个个的搜索可能会超时
二 大致思路:
1.得到固定的每个 word 长度为 n
2.从 s 的第一个字符开始,截取从 i 开始长度为n的字符串
string str(s.substr(i,n));
3.之后以跨度为 n 的长度,继续截取字符串,截取的次数要和words 里面的字符串个数 wsize 一样,最后如果都匹配,则是答案,加入结果容器 vec 中,以上是大致思路,可以直接暴力,很可能超时
4.注意这里其实出现了大量重叠的现象,比如以第一个例子来说,当i = 0时,截取第一段字符串str,发现是words里面的字符串,继续截取判断,从 j = 3开始,比较刚好又是words里面的字符串,那么在这时可以适当的保存这个信息(信息包括当前下标可以截取有效的字符串以及截取的字符串),因为你的 i 怎么都会循环到 3,这里我用了map,保存 j = 3时截取的字符串。
map<int,string> smap ;
smap[j] = str;
并且我用了一个数组来保存当前字符串的标志位,0代表没有访问过,1代表访问过,且可以截取words里面的字符串,-1代表访问过,但截取的字符串没有在words里面。
int arr[ssize];
for(int i = 0;i < ssize;i++){
arr[i] = 0;
}
5.为啥要用map?我实际上用了三个map,一个wmap用来保存words里面的字符串(便于判断截取的字符串是否存在于words里面),以及出现的次数(用于终极判别),第二个smap用来存储s中可以截取words中存在的字符串的下标及字符串,第三个tmap(是wmap的一个复制品)用来判断,截取字符串出现的次数
6.什么时候continue或者break?判断的时候,当前下标不符合要求的情况,第一,当前下标已经判断过arr[i] == -1,第二,没判断过,截取的字符串不存在wmap中,第三,tmap中显示你当前截取的字符串不需要了
7.这样循环变成了从i = 0开始,首先判断arr[i],判断是否被访问过,为-1表示不符合直接continue,为1直接在smap中得到截取的字符串,为0就要截取字符串,之后再进入一个循环进入后面邻接字符串的判断,判断方法一致,出现的字符串会在tmap中对应的字符串数量减1,为0表示我不需要当前字符串了
有点啰嗦,但是思路应该是对的,代码如下:
class Solution {
public:
vector<int> findSubstring(string s, vector<string>& words) {
vector<int> vec;
int ssize = s.size();
int wsize = words.size();
if(ssize == 0||wsize == 0||ssize < wsize) return vec;
int n = words[0].size();
if(ssize < n) return vec;
map<string,int> wmap;
//map<string,int> tmap;
map<int,string> smap;
map<string,int>::iterator wite;
map<int,string>::iterator site;
int arr[ssize];
for(int i = 0;i < ssize;i++){
arr[i] = 0;
}
for(int i = 0;i < wsize;i++){
wite = wmap.find(words[i]);
if(wite != wmap.end()){
wmap[words[i]]++;
}else{
wmap[words[i]] = 1;
}
}
for(int i = 0;i < (ssize - n * wsize + 1);i++){
if(arr[i] == -1) continue;
if(arr[i] == 0){
string str(s.substr(i,n));
wite = wmap.find(str);
if(wite != wmap.end()){
arr[i] = 1;
smap[i] = str;
}else{
arr[i] = -1;
continue;
}
}
map<string,int> tmap(wmap);
int j;
for(j = 0;j < wsize;j++){
int z = i+j*n;
if(arr[z] == -1) break;
if(arr[z] == 0){
string str3(s.substr(z,n));
wite = wmap.find(str3);
if(wite != wmap.end()){
smap[z] = str3;
arr[z] = 1;
}else{
arr[z] = -1;
break;
}
}
string str2(smap[z]);
if(tmap[str2] == 0) break;
else tmap[str2]--;
}
if(j == wsize) vec.push_back(i);
}
return vec;
}
};
心得:还需要整理一下,有些地方还是繁琐,但是这题值得回味!