-
描述
-
给定一段文章,每行不超过1000个字符,统计文章中每个单词出现的频率,忽略大小写差异。
注意:单词的不同形态看做是不同的单词,不考虑连字符,所有非大小写字母都视为只起到分割作用。
-
输入
-
第一行为一个整数T,表示数据的组数。
对于每组数据以一个独占一行的句号('.')结束。
输出
-
对于每组测试数据:
第一行为一个整数n表示文章中出现的单词的总数;
接下来n行按字母序从小到大输出文章中出现的单词(全部以大写字母表示)和出现的频数。
样例输入
2
Hello World!
.
Abc abc-cde aa1bb2cc3 aas’ (test)...
.
样例输出
2
HELLO 1
WORLD 1
7
AA 1
AAS 1
ABC 2
BB 1
CC 1
CDE 1
TEST 1
此题是简单的统计,然后排序,但要注意以下几点:
首先, 每组数据没说只有一行, 只是说每一行不超过1000个字符, 所以一行一行读, 直到读到一行是'.'结束
第二, 当一行的最后一个字符是字母的时候, 你没有处理这最后一个单词, 比如这一行是"ABC.ABC", 那么结果应该是ABC 2, 但是你的程序会输出ABC 1, 因为你没处理最后一个单词ABC, 原因是因为你只有当出现不是字母的时候才处理前面一个单词, 但是结尾如果就是字母那么就出错了
#include <stdio.h> #include <string.h> int main() { int t,number; int i,j; int k,l; char a[1000][1001]; int b[1000]; char temp2[1001]; char temp[1001]; int temp3; int length; char en[3]; scanf("%d",&number); getchar(); for(t=1;t<=number;t++) { k=0; l=0; memset(a,'\0',sizeof(a)); memset(b,0,sizeof(b)); while(true) { gets(temp); if(temp[0] == '.' &&strlen(temp) == 1) { break;} length=strlen(temp); for(i=0;i<length;i++) { if(temp[i]>='A'&&temp[i]<='Z') { temp2[l++]=temp[i]; } else if(temp[i]>='a'&&temp[i]<='z') { temp2[l++]=temp[i]-32; } else { temp2[l]='\0'; if(l==0) continue; for(j=0;j<k;j++) { if(strcmp(a[j],temp2)==0) { b[j]++; break; } } if(j==k) { strcpy(a[j],temp2); b[j]++; k++; } l=0; } } temp2[l]='\0'; if(l==0) continue; for(j=0;j<k;j++) { if(strcmp(a[j],temp2)==0) { b[j]++; break; } } if(j==k) { strcpy(a[j],temp2); b[j]++; k++; } l=0; } for(i=0;i<k;i++) for(j=i+1;j<k;j++) { if(strcmp(a[i],a[j])>0) { strcpy(temp2,a[j]); temp3=b[j]; strcpy(a[j],a[i]); b[j]=b[i]; strcpy(a[i],temp2); b[i]=temp3; } } printf("%d\n",k); for(i=0;i<k;i++) { printf("%s %d\n",a[i],b[i]); } } return 0; }
-
1319 单词统计
最新推荐文章于 2021-05-21 09:29:20 发布