题目:
给定一个字符串,输出其最大的包含单词个数以及所包含的单词。限制条件如下:
1.每份中包含的单词可以部分重叠。
2.当选用一个单词后,其第一个字母不能再用。例如字母串this中可包含this和is,选用this之后就不能包含th,因为t开头的单词已经包含在内了。
输入一个字符串、字典中单词的个数以及词典内容,输出最大的包含单词个数以及所包含的单词。
该题目是CODEVS2010的变体(部分功能)。
思路:
简单来说就是先将字符串切片,然后逐个匹配字典中的单词。
用一个例子讲解应该会清楚一些:例如有 thisisabookyouareaoh 这样一个字符串,字典中有5个单词,分别为 a, is, ok, this, book。
切片涉及到起始位置,因此我们用变量left记录切下来的子字符串的开头在原字符串中的下标,用right记录切下来的字符串的结尾在原字符串中的下标,例如sabo这个子字符串的left=5,right=8。并且定义一个字符串变量temp存储该子字符串,即temp=‘sabo’。
再来讲一下切片的过程:
先将left固定(假设此时left=0),right的初始值设为和left相同,此时切下来的字符串长度为1,切下来的子字符串为 ‘t’,将其赋给temp变量,temp = ‘t’,再遍历字典中的所有单词,判断temp是否为字典中的某个单词,若有,则该temp即为我们所要求的一个单词,将其存储下来,left右移(left++),寻找字符串中下一个出现的单词;若遍历完整个字典,没有找到匹配的单词,那么right向右移(right++),继续匹配。temp = ‘t’时没有匹配到任何一个单词,因此right向右移,此时切下来的字符串长度变为2,后面过程和刚刚一样,即temp = ‘th’,再遍历字典中的所有单词,也没有找到匹配的单词,right向右移(right++),继续匹配...直到temp=‘this’时,匹配到字典中的‘this’单词,将this存储在result数组中(result数组存放切片后匹配上的的子字符串)。left右移,right的初始值设为和left相同,此时temp=‘h’,...继续该过程,直到left移动到原字符串末尾。
得注意的是,right右移到多少为止?如果右移到字符串的末尾,结果不会错,但是会浪费很多时间,因为切下来的字符串长度如果大于字典中最长单词的长度,那么是不可能有匹配单词的,因此我们right最大等于left+maxlength即可(maxlength为字典中的最长单词的长度)。
代码如下:
// Chapter14_6.cpp : Defines the entry point for the application.
// 统计单词个数
#include "stdafx.h"
#include<iostream>
#include<string>
using namespace std;
//定义字典中所能存放的单词个数
const int max_dic = 5;
//求字典中最长单词的长度函数
int max_length(string *str,int n)
{
int max = str[0].length();
for(int i=1;i<n;i++)
{
if(str[i].length() > max)
max = str[i].length();
}
return max;
}
int main()
{
string str; //原字符串(输入的需要匹配的字符串)
int n; //字典中单词的个数
int maxlength; //字典中最长单词的长度
string dic[max_dic]; //字典
string result[20]; //存放匹配到的单词
int i,j; //循环变量
int count = 0; //计数变量
//输入
cout << "输入需要匹配的字符串:" << endl;
cin >> str;
cout << "输入字典中的单词个数:";
cin >> n;
cout << "输入字典中的单词:" << endl;
for(i=0;i<n;i++)
cin >> dic[i];
//求字典中最长单词的长度
maxlength = max_length(dic,n);
//left:切片的起始位置,right:切片的终止位置
int left = 0,right = 0;
//切片的起始位置移动到原字符串的末尾为止
while(left < str.length())
{
//left加1和right加1的标志变量,flag=0表示未找到匹配,right加1;flag=1表示找到匹配,left加1
int flag = 0;
//遍历不同长度的子字符串
for(right=left;right<= left+maxlength;right++)
{
//求子字符串
string temp = "";
for(i=left;i<=right;i++)
temp = temp + str[i];
//cout << "temp = " << temp << endl;
//与字典中的单词进行比对
for(i=0;i<n;i++)
{
//若匹配到一个单词
if(temp == dic[i])
{
result[count] = temp; //将其存储在result数组中
count++; //计数变量加1
flag = 1; //flag置1(目的是退出外for循环)
break;
}
}
if(flag == 1)
break;
}
//从下个字符开始进行匹配
left++;
}
cout <<"一共有"<< count << "个单词,分别为:" << endl;
for(i=0;i<count;i++)
cout << result[i] << ' ';
cout << endl;
system("pause");
return 0;
}
运行结果如下:
如果想了解切片和匹配的过程,可以将代码中的注释行,放开,即
cout << "temp = " << temp << endl;
运行结果如下: