Description
在当前目录中存在文件名为"case1.in"(其中case后为数字1,不是字母l,写错提交后会判错)的文本文件, 其内容为一篇英文文章(以EOF作为结束标志)。现要求读取该文本文件内容,统计文章中每个单词出现的次数, 并输出出现次数最多的前5个单词及其出现次数(按出现次数由多到少的顺序输出,次数相同时按字典顺序输出, 不足5个单词时,按序输出全部单词)。程序中注意如下细节: (1) 空格、标点符号与回车符起到分隔单词的作用。 (2) 文章一行的末尾可能有连字符,出现连字符时,该行最末的字符串与下行最先出现的字符串构一个单词; (3) 名词缩写算一个单词; (4) 数字不算单词; (5) 单词不区分大小写; (6) 输出时单词全使用小写;
#include "stdio.h"
#include "math.h"
#include "string.h"
#include "stdlib.h"
_______________________
main()
{
_______________________
}
输入格式
文件case1.in中一篇英文文章,包含多段文字,单词数不超过10000,每个单词不超过20个字符
输出格式
按题意输出答案
输入样例
(如case1.in内容如下) I am a student. My school is SCAU. It is a beau- tiful university. I like it.
输出样例
a 2 i 2 is 2 it 2 am 1
实验课的东西,没有算法,没有散列,思路简单,写了点注释
#include "stdio.h"
#include "math.h"
#include "string.h"
#include "stdlib.h"
struct WORD
{
char c[21]; //记录单词
int count; //记录单词次数
} word[10001];
int num;
void tongji(char *temp)
{
int i,flag=0;
for(i=0; i<num; i++)
{
if(strcmp(word[i].c,temp)==0)
{
word[i].count++;
flag=1; //出现过就把flag赋值为1,然后该单词次数+1,跳出循环
break;
}
}
if(flag==0) //flag==0代表没出现过
{
strcpy(word[num].c,temp); //把temp记录的单词复制到word数组的最后一个中
word[num].count=1; //次数记录为1
num++; //总单词数+1
}
}
//下面这个函数是对qsort函数排序方式的声明,return的值<0,则在qsort函数中不改变两者顺序,大于0,在qsort中交换两者顺序。只是一个函数的用法,不用问为什么
int cmp(const void *a,const void *b)
{
struct WORD *ta=(struct WORD *)a;//强制转换ab成我们已经声明的结构体类型。在此处用ta,tb只是为了表达的方便
struct WORD *tb=(struct WORD *)b;
if(ta->count!=tb->count) return tb->count-ta->count;//两个单词的出现次数不同,用第二个参数减第一个,实现从大到小排
else return (strcmp(ta->c, tb->c));//出现的次数相同,用strcmp比较字典顺序,strcmp如果第一个参数小于第二个参数,
//返回-1,-1在qsort中就是不改变顺序,跟我们要的结果一样,所以在此处我们才能直接把strcmp的值作为返回值
}
main()
{
int i=0,n=5; //i起到记录临时单词长度的作用,n是为了在最后输出时与num比较而声明的
char ch,temp[21]; //ch读入单个字符,temp存放临时单词
FILE *fp;
fp=fopen("case1.in","r");
while((ch=fgetc(fp))!=EOF)
{
LOOP:
if(ch>='A'&&ch<='Z') ch=ch+32;//大写转小写
if(ch>='a'&&ch<='z') temp[i++]=ch;
else if(ch=='-')
{
ch=fgetc(fp);
if(ch=='\n');
else
{
if(i!=0) //所有的统计操作都要在temp有读入字符的前提下进行,即此时i>0,所以这里要判断
{
temp[i]='\0'; //将单词最后一个赋值为结束符
i=0; //一个读完,要重新初始化单词长度
tongji(temp);
}
if(ch!=EOF) goto LOOP; //不是EOF,重新回到LOOP那里执行
else break; //EOF,就结束啦,所以直接break,跳出while
}
}
else
{
if(i!=0) //这里的判断跟上面的原因一样
{
temp[i]='\0';
i=0;
tongji(temp);
}
}
}
if(i>0)
{
temp[i]='\0';
tongji(temp);
}
fclose(fp);
qsort(word,num,sizeof(struct WORD),cmp);
if(num<5) n=num; //前面给了n=5,这里实际上是拿5和num比较,小的那个就给n
for(i=0; i<n; i++) printf("%s %d\n",word[i].c,word[i].count);
}