P1308 [NOIP2011 普及组] 统计单词数题解

最新推荐文章于 2024-04-10 10:52:01 发布

互联网的猫

最新推荐文章于 2024-04-10 10:52:01 发布

阅读量445

点赞数 9

分类专栏： C++ 文章标签：算法 c++

本文链接：https://blog.csdn.net/m0_72674633/article/details/135508574

版权

C++ 专栏收录该内容

34 篇文章 0 订阅

订阅专栏

题目

一般的文本编辑器都有查找单词的功能，该功能可以快速定位特定单词在文章中的位置，有的还能统计出特定单词在文章中出现的次数。

现在，请你编程实现这一功能，具体要求是：给定一个单词，请你输出它在给定的文章中出现的次数和第一次出现的位置。注意：匹配单词时，不区分大小写，但要求完全匹配，即给定单词必须与文章中的某一独立单词在不区分大小写的情况下完全相同（参见样例 1），如果给定单词仅是文章中某一单词的一部分则不算匹配（参见样例 2）

输入输出格式

输入格式

共2行。第1行为一个字符串，其中只含字母，表示给定单词；第2行为一个字符串，其中只可能包含字母和空格，表示给定的文章。

输出格式

一行，如果在文章中找到给定单词则输出两个整数，两个整数之间用一个空格隔开，分别是单词在文章中出现的次数和第一次出现的位置（即在文章中第一次出现时，单词首字母在文章中的位置，位置从0开始）；如果单词在文章中没有出现，则直接输出一个整数−1。

注意：空格占一个字母位。

输入输出样例

输入样例

To
to be or not to be is a question

输出样例

2 0

代码

//指针做法
#include<iostream>
#include<cstring>
#include<cctype>
using namespace std;
void strlower(char *a) {
    for(int i = 0; a[i]; i++) {
        if(isupper(a[i])) {
            a[i] = tolower(a[i]);
        }
    }
}
int main() {
    char destination[1000001], *q, source[11], *p;
    bool flag = false;
    int ans = 0, ans1 = -1;

    cin.getline(source,11);//getline比gets更安全，允许指定要读取的最大字符数，从而避免了缓冲区溢出的问题 
    cin.getline(destination,1000001);

    strlower(destination);
    strlower(source);

    int len = strlen(source);

    p = destination;

    for (; q = strstr(p, source);) {//strstr查询source在p中是否存在，如果存在返回它的第一个位置，如果不存在，则返回null 
        if (q != NULL&&(q == destination || *(q - 1) == ' ')&&(*(q + len) == '\0' || *(q + len) == ' ')) {
            ans++;
            if (!flag) {
                flag = true;
                ans1 = q - destination;
            }
        }
        p = q + len;
    }
    if (flag) {
        cout << ans << " " << ans1 <<endl;
    } else {
        cout << ans1 <<endl;
    }
    return 0;
}

//有穷自动机
#include<iostream>
#include<cstdio>
#include<cctype>
#include<cstring>
using namespace std; 
const int SPACE = 0;//三种状态，这是空格状态
const int LETTER = -1;//字母状态，但这表示不是要查找的单词的字母的状态
const int WORD = 1;//而这种状态是要查找的单词的状态
///如果状态是大于1的数，说明是要查找的单词的中间部分的状态
void strlower (char *a) {
    for(int i = 0; a[i]; i ++ ) {
        if(isupper(a[i])) a[i] = tolower(a[i]);
    }
}
int main () {
    char a[1000001], word[20];
    int ans = 0;
    int ans2 = -1;
    int state = 0;//表状态，假设是空格，因为空格上来就判断是不是三种状态
    int i;
    cin.getline(word,20);
    cin.getline(a,1000001);//输入
    strlower(a);
    strlower(word);//大小写
    int len = strlen(word);//长度
        
    for(i = 0; a[i]; i ++ ) {//遍历数组
        switch(state){//判断上一个的状态
            case SPACE : //如果上一个是空格
                if(a[i] == word[0]) state = WORD;//变成单词第一个字母状态
                else if(a[i] == ' ') state = SPACE;
                else state = LETTER;
                break;
            case LETTER : //是其他字母状态
                if(a[i] == ' ') state = SPACE;//空格状态
                break;
            default: //是要查找的单词状态
                if (state < len) {//还不是最后一个字母
                    if(a[i] == ' ') state = SPACE;
                    else if(a[i] == word[state]) state++;//变成下一个字母状态
                    else state = LETTER;//其他字母状态
                }
                else if (state == len)//是最后一个字母
                {	
                    if(a[i] == ' ') {//如果下一个是空格，找到了！
                        state = SPACE;//状态改变
                            if(ans2 == -1)//第一次找到，记录下来位置
                                ans2 = i - len;//因为i是单词的尾，所以要减长度
                        ans ++ ;//个数加一
                    }
                    else state = LETTER;//最后跟着其他字母，不是单词
                }
        }

    }
    if(state == len) {
        ans ++ ;
        if(ans2 == -1)
            ans2 = i - 1 - len;
    }
    if(ans2 == -1) printf("-1");
    else printf("%d %d", ans, ans2);
    return 0;
}