问题 B: P2 统计单词数
时间限制: 1 Sec 内存限制: 128 MB
提交: 62 解决: 15
题目描述
统计单词数 (stat.cpp/c/pas)
一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中的次数。
现在,请你编程实现这一功能,具体要求是:给定一个单词,请你输出它在给定的文章中出现的次数和第一次出现的位置。注意:匹配单词时,不区分大小写,但要求完全匹配,即单词必须与文章中某一独立残次在不区分大小写的情况下完全相同(参见样例1),如果给定单词仅是文章中某一单词的一部分则不算匹配(参见样例2)。
输入
输入文件共2行。
第1行为一个字符串,其中只包含字母,表示给定单词;
第2行为一个字符串,其中只可能包含字母和空格,表示给定的文章。
输出
只有1行,如果在文章中找到给定单词则输出两个整数,两个整数之间用一个空格隔开,分别是单词在文章中出现的次数和第一次出现的位置(即在文章中第一次出现时,单词首字母在文章中的位置,位置从0开始);如果单词在文章中没有出现,则直接输出一个整数-1。
样例输入
输入样例1: To to be or not to be is a question 输入样例2: to Did the Ottoman Empire lose its power at that time
样例输出
输出样例1: 2 0 输出样例2: -1
提示
1<=单词长度<=10。
1<=文章长度<=10,000,000。
经验总结
这里,在比较之前需要将字符串全部转为小写(或大写),在匹配成功时,要检查文本串中匹配的模式串的前后是否是空格,是空格才能说明这是一个独立的单词,否则不符合题目要求,匹配次数不增加。
正确代码
#include <cstdio>
#include <algorithm>
#include <cstring>
#include <vector>
#include <iostream>
#include <string>
using namespace std;
const int maxn=300;
int nextval[maxn],pos;
bool flag=false;
void getNextval(string str)
{
int j=-1;
nextval[0]=-1;
for(int i=1;i<str.length();++i)
{
while(j!=-1&&str[i]!=str[j+1])
{
j=nextval[j];
}
if(str[i]==str[j+1])
{
++j;
}
if(j==-1||str[i+1]!=str[j+1])
{
nextval[i]=j;
}
else
{
nextval[i]=nextval[j];
}
}
}
void toLower(string &str)
{
for(int i=0;i<str.length();++i)
{
if(str[i]>='A'&&str[i]<='Z')
str[i]+=32;
}
}
int KMP(string str1,string str2)
{
int ans=0,j=-1;
int n=str1.length(),m=str2.length();
for(int i=0;i<n;++i)
{
if(j!=-1&&str1[i]!=str2[j+1])
{
j=nextval[j];
}
if(str1[i]==str2[j+1])
{
++j;
}
if(j==m-1)
{
if(i-m>=0&&i<n-1&&str1[i+1]==' '&&str1[i-m]==' '||i-m+1==0&&i<n-1&&str1[i+1]==' '||i-m>=0&&i==n-1&&str1[i-m]==' '||i-m+1==0&&i==n-1)
{
ans++;
if(flag==false)
{
pos=i-m+1;
flag=true;
}
}
j=nextval[j];
}
}
return ans;
}
int main()
{
int n,ans;
string str1,str2;
while(getline(cin,str1))
{
toLower(str1);
getNextval(str1);
ans=0;
getline(cin,str2);
toLower(str2);
flag=false;
ans+=KMP(str2,str1);
if(ans==0)
printf("-1\n",ans);
else
printf("%d %d\n",ans,pos);
}
return 0;
}