阿里2018秋招编程题
1、给定一个字符串S和有效单词的字典D,请确定可以插入到S中的最小空格数,使得最终的字符串完全由D中的有效单词组成,并输出解。如果没有解则应该输出n/a
举例:
输入
S = “ilikealibaba”
D = [“i”, “like”, “ali”, “liba”, “baba”, “alibaba”]
Example Output:
输出
“i like alibaba”
解释:
字符串S可能被字典D这样拆分
“i like ali baba”
“i like alibaba”
很显然,第二个拆分分结果是空格数最少的解。
解题思路
定义一个两个指针left和right,[left, right]形成一个字符串窗口或者单词word,left和right最开始指向S的第一个字符,基本思路是:搜索S,尽可能找到一个最长的窗口word[left,right],使得word是Dict的有效字符,如果找到,left指针可以跳过word.len个位置,然后继续向右搜索,直到S末尾。
但是,按照这个思路发现,“尽可能找一个最长的word[left, right]”有可能会使得破坏right后面的字符串的匹配,从而使得该题无解。比如:
S=“aaaabbccaa”Dict=[aa, aabbcc, aabbcca, bc],如果按照上述解题思路,那么会发现无解,即在搜索过程中,遇到aabbcc和aabbcca这种情况,选择了后者,然后导致最后只剩下a,无法匹配,破坏的aabbcc和aa的匹配。
ps: 在网上看到其他人用这个思路,可以通过阿里的测试样例,那他的测试样例就有问题了
c++代码:
#include <iostream>
#include <set>
#include <string>
#include <vector>
using namespace std;
void mincut(const string& str, const set<string>& dict)
{
if (str.empty() || dict.empty()) {
cout << "n/a";
return;
}
int left = 0,right = 1, len = str.size();
vector<string> selections;
while(right < len){
string word = str.substr(left,right-left);
if(dict.find(word)!=dict.end()){
int e = right + 1;
while(e <= len && dict.find(str.substr(left,e-left))==dict.end())
e++;
if(e <= len) {
selections.push_back(str.substr(left,e-left));
left = right = e;
}
else{
selections.push_back(word);
left = right;
}
}
right++;
}
cout<<right<<" "<<left<<endl;
if(right-left>1){
cout<<"n/a";
}
else{
len = selections.size();
for(int i=0; i<len; i++)
cout<<selections[i]<<" ";
}
}
int main(int argc, const char * argv[])
{
string strS;
string dictStr;
int nDict;
set<string> dict;
cin >> strS;
cin >> nDict;
for (int i = 0; i < nDict; i++)
{
cin >> dictStr;
dict.insert(dictStr);
}
mincut(strS, dict);
return 0;
}