P1308 [NOIP2011 普及组] 统计单词数题解

题目

一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数。

现在,请你编程实现这一功能,具体要求是:给定一个单词,请你输出它在给定的文章中出现的次数和第一次出现的位置。注意:匹配单词时,不区分大小写,但要求完全匹配,即给定单词必须与文章中的某一独立单词在不区分大小写的情况下完全相同(参见样例 1),如果给定单词仅是文章中某一单词的一部分则不算匹配(参见样例 2)

输入输出格式

输入格式

共2行。第1行为一个字符串,其中只含字母,表示给定单词;第2行为一个字符串,其中只可能包含字母和空格,表示给定的文章。

输出格式

一行,如果在文章中找到给定单词则输出两个整数,两个整数之间用一个空格隔开,分别是单词在文章中出现的次数和第一次出现的位置(即在文章中第一次出现时,单词首字母在文章中的位置,位置从0开始);如果单词在文章中没有出现,则直接输出一个整数−1。

注意:空格占一个字母位。

输入输出样例

输入样例

To
to be or not to be is a question

输出样例

2 0

代码

//指针做法
#include<iostream>
#include<cstring>
#include<cctype>
using namespace std;
void strlower(char *a) {
    for(int i = 0; a[i]; i++) {
        if(isupper(a[i])) {
            a[i] = tolower(a[i]);
        }
    }
}
int main() {
    char destination[1000001], *q, source[11], *p;
    bool flag = false;
    int ans = 0, ans1 = -1;

    cin.getline(source,11);//getline比gets更安全,允许指定要读取的最大字符数,从而避免了缓冲区溢出的问题 
    cin.getline(destination,1000001);

    strlower(destination);
    strlower(source);

    int len = strlen(source);

    p = destination;

    for (; q = strstr(p, source);) {//strstr查询source在p中是否存在,如果存在返回它的第一个位置,如果不存在,则返回null 
        if (q != NULL&&(q == destination || *(q - 1) == ' ')&&(*(q + len) == '\0' || *(q + len) == ' ')) {
            ans++;
            if (!flag) {
                flag = true;
                ans1 = q - destination;
            }
        }
        p = q + len;
    }
    if (flag) {
        cout << ans << " " << ans1 <<endl;
    } else {
        cout << ans1 <<endl;
    }
    return 0;
}
//有穷自动机
#include<iostream>
#include<cstdio>
#include<cctype>
#include<cstring>
using namespace std; 
const int SPACE = 0;//三种状态,这是空格状态
const int LETTER = -1;//字母状态,但这表示不是要查找的单词的字母的状态
const int WORD = 1;//而这种状态是要查找的单词的状态
///如果状态是大于1的数,说明是要查找的单词的中间部分的状态
void strlower (char *a) {
    for(int i = 0; a[i]; i ++ ) {
        if(isupper(a[i])) a[i] = tolower(a[i]);
    }
}
int main () {
    char a[1000001], word[20];
    int ans = 0;
    int ans2 = -1;
    int state = 0;//表状态,假设是空格,因为空格上来就判断是不是三种状态
    int i;
    cin.getline(word,20);
    cin.getline(a,1000001);//输入
    strlower(a);
    strlower(word);//大小写
    int len = strlen(word);//长度
        
    for(i = 0; a[i]; i ++ ) {//遍历数组
        switch(state){//判断上一个的状态
            case SPACE : //如果上一个是空格
                if(a[i] == word[0]) state = WORD;//变成单词第一个字母状态
                else if(a[i] == ' ') state = SPACE;
                else state = LETTER;
                break;
            case LETTER : //是其他字母状态
                if(a[i] == ' ') state = SPACE;//空格状态
                break;
            default: //是要查找的单词状态
                if (state < len) {//还不是最后一个字母
                    if(a[i] == ' ') state = SPACE;
                    else if(a[i] == word[state]) state++;//变成下一个字母状态
                    else state = LETTER;//其他字母状态
                }
                else if (state == len)//是最后一个字母
                {	
                    if(a[i] == ' ') {//如果下一个是空格,找到了!
                        state = SPACE;//状态改变
                            if(ans2 == -1)//第一次找到,记录下来位置
                                ans2 = i - len;//因为i是单词的尾,所以要减长度
                        ans ++ ;//个数加一
                    }
                    else state = LETTER;//最后跟着其他字母,不是单词
                }
        }

    }
    if(state == len) {
        ans ++ ;
        if(ans2 == -1)
            ans2 = i - 1 - len;
    }
    if(ans2 == -1) printf("-1");
    else printf("%d %d", ans, ans2);
    return 0;
}

  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 题目描述: 给定一个英文文章,统计其中不同单词的个。 输入格式: 输入文件包含若干行,每行是一个由大小写字母、逗号、句号和空格成的字符串,表示一篇英文文章。每个字符串的长度不超过100。 输出格式: 输出文件仅一行,包含一个整,表示输入文件中不同单词的个。不区分大小写,相同的单词计为一个。 输入样例: This is a test. Hello world, hello China. 输出样例: 7 解题思路: 本题需要统计文章中不同单词的个,不区分大小写,相同的单词计为一个。因此,我们可以使用哈希表来统计每个单词出现的次,最后输出哈希表中不同单词的个即可。 具体实现时,我们可以先将文章中的所有单词转换为小写字母,然后使用字符串流istringstream将每个单词读入,再将其插入哈希表中。最后,输出哈希表中不同单词的个即可。 代码实现: ### 回答2: 题目描述 给定一篇英语文章,统计其中单词量。单词是指仅由英文字母成的、不包含字、标点符号等非字母字符的字符串。大小写不敏感,例如“abc”和“ABC”视为同一个单词。 输入格式: 共一行,为英语文章,长度不超过1000。 输出格式: 共一行,为不同单词量。 思路分析 本题可以采用 map 或 set 来记录每个单词出现的次,也可以通过字符串处理直接进行字符判断,统计单词。 方法一 首先将文章中所有小写字母转换成大写字母,再遍历每个字符,若是字母,则将其加入当前单词中,若是除字母外的其他字符,则将当前单词加入 set,清空当前单词,同时统计单词。 代码如下: #include <iostream> #include <set> using namespace std; int main() { string s; getline(cin, s); int n = s.size(); set<string> words; string cur_word; for(int i = 0; i < n; i ++) { if(s[i] >= 'a' && s[i] <= 'z') s[i] = s[i] - 'a' + 'A'; if(s[i] >= 'A' && s[i] <= 'Z') cur_word += s[i]; else { if(cur_word.size()) words.insert(cur_word); cur_word.clear(); } } if(cur_word.size()) words.insert(cur_word); cout << words.size() << endl; return 0; } 方法二 使用 STL 的 map 容器,记录每个单词出现的次统计不同单词量。 代码如下: #include <iostream> #include <map> using namespace std; int main() { map<string, int> words; string s, cur_word; getline(cin, s); int n = s.size(); for (int i = 0; i < n; i ++) { if(s[i] >= 'a' && s[i] <= 'z') s[i] = s[i] - 'a' + 'A'; if(s[i] >= 'A' && s[i] <= 'Z') cur_word += s[i]; else { if(cur_word.size()) words[cur_word] ++; cur_word.clear(); } } if(cur_word.size()) words[cur_word] ++; cout << words.size() << endl; return 0; } C++ 代码 ### 回答3: 题目描述: 给定一个以空格为分隔符的字符串,统计其中单词目。 分析: 本题其实是一个字符串的基础操作,需要用到的知识点包括字符串的定义和基本操作、循环语句等。 对于本题,我们可以使用一个计器来记录字符串中单词目,每次遇到空格符就将计器加一。由于题目中要求单词的前后不能有空格,所以我们需要对字符串首位的空格进行处理。最后输出计器的值即可。 代码实现: String s = sc.nextLine();//读取输入的字符串 s = s.trim();//去掉字符串首尾的空格 int count = 0;//定义计器 for(int i = 0; i < s.length(); i++){//循环遍历字符串中的每一个字符 if(s.charAt(i) == ' '){//遇到空格符,计器加一 count++; } } System.out.println(count+1);//输出计器的值 注:这里加一的原因是最后一个单词后面没有空格,所以需要再加一。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

互联网的猫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值