1319 单词统计

最新推荐文章于 2021-05-21 09:29:20 发布

Felven

最新推荐文章于 2021-05-21 09:29:20 发布

阅读量2.4k

点赞数

分类专栏： AC路漫漫文章标签：测试

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/zhaoxinfan/article/details/7245299

版权

AC路漫漫专栏收录该内容

1761 篇文章 29 订阅

订阅专栏

描述

给定一段文章，每行不超过1000个字符，统计文章中每个单词出现的频率，忽略大小写差异。

注意：单词的不同形态看做是不同的单词，不考虑连字符，所有非大小写字母都视为只起到分割作用。

输入

第一行为一个整数T，表示数据的组数。

对于每组数据以一个独占一行的句号('.')结束。

输出

对于每组测试数据：

第一行为一个整数n表示文章中出现的单词的总数；

接下来n行按字母序从小到大输出文章中出现的单词(全部以大写字母表示)和出现的频数。

样例输入
2
Hello World！
.
Abc abc-cde aa1bb2cc3 aas’ (test)...
.
样例输出
2
HELLO 1
WORLD 1
7
AA 1
AAS 1
ABC 2
BB 1
CC 1
CDE 1
TEST 1

此题是简单的统计，然后排序，但要注意以下几点：

首先, 每组数据没说只有一行, 只是说每一行不超过1000个字符, 所以一行一行读, 直到读到一行是'.'结束
第二, 当一行的最后一个字符是字母的时候, 你没有处理这最后一个单词, 比如这一行是"ABC.ABC", 那么结果应该是ABC 2, 但是你的程序会输出ABC 1, 因为你没处理最后一个单词ABC, 原因是因为你只有当出现不是字母的时候才处理前面一个单词, 但是结尾如果就是字母那么就出错了

#include <stdio.h>
#include <string.h>

int main()
{
    int t,number;

    int i,j;
    int k,l;

    char a[1000][1001];
    int b[1000];

    char temp2[1001];

    char temp[1001];
    int temp3;
    int length;

    char en[3];


    scanf("%d",&number);
    getchar();

    for(t=1;t<=number;t++)
    {
        k=0;
        l=0;

        memset(a,'\0',sizeof(a));
        memset(b,0,sizeof(b));

        while(true)
        {
            gets(temp);
            if(temp[0] == '.' &&strlen(temp) == 1) { break;}

            length=strlen(temp);


            for(i=0;i<length;i++)
            {
                if(temp[i]>='A'&&temp[i]<='Z')
                {
                    temp2[l++]=temp[i];

                }
                else if(temp[i]>='a'&&temp[i]<='z')
                {
                    temp2[l++]=temp[i]-32;
                }

                else
                {
                    temp2[l]='\0';

                    if(l==0) continue;

                    for(j=0;j<k;j++)
                    {
                        if(strcmp(a[j],temp2)==0)
                        {
                            b[j]++;
                            break;
                        }

                    }
                    if(j==k)
                    {
                        strcpy(a[j],temp2);
                        b[j]++;
                        k++;
                    }

                    l=0;
                }
            }

            temp2[l]='\0';

            if(l==0) continue;

            for(j=0;j<k;j++)
            {
                if(strcmp(a[j],temp2)==0)
                {
                    b[j]++;
                    break;
                }

            }
            if(j==k)
            {
                strcpy(a[j],temp2);
                b[j]++;
                k++;
            }

            l=0;



        }
        for(i=0;i<k;i++)
            for(j=i+1;j<k;j++)
            {
                if(strcmp(a[i],a[j])>0)
                {
                    strcpy(temp2,a[j]);
                    temp3=b[j];
                    strcpy(a[j],a[i]);
                    b[j]=b[i];
                    strcpy(a[i],temp2);
                    b[i]=temp3;

                }
            }
        printf("%d\n",k);
        for(i=0;i<k;i++)
        {
            printf("%s %d\n",a[i],b[i]);
        }

    }


    return 0;
}