词频统计

【问题描述】

编写程序统计一个英文文本文件中每个单词的出现次数(词频统计),并将统计结果按单词字典序输出到屏幕上。

注:在此单词为仅由字母组成的字符序列。包含大写字母的单词应将大写字母转换为小写字母后统计。

【输入形式】

打开当前目录下文件article.txt,从中读取英文单词进行词频统计。

【输出形式】

程序将单词统计结果按单词字典序输出到屏幕上,每行输出一个单词及其出现次数,单词和其出现次数间由一个空格分隔,出现次数后无空格,直接为回车。

【样例输入】

当前目录下文件article.txt内容如下:

Do not take to heart every thing you hear.

Do not spend all that you have.

Do not sleep as long as you want;

【样例输出】

all 1

as 2

do 3

every 1

have 1

hear 1

heart 1

long 1

not 3

sleep 1

spend 1

take 1

that 1

thing 1

to 1

want 1

you 3

【样例说明】

按单词字典序依次输出单词及其出现次数。

【实现要求】

用数组或链表实现

【评分标准】

通过所有测试点将得满分。

#include <stdio.h>
#include <string.h>
#define MAX 101
char a[MAX][MAX];
char b[MAX]={0};
char c[MAX][MAX]; 
char d[MAX][MAX];
int num[MAX];
int main()
{
	FILE *f;
	int n=0,i,len,j,p=0,q=0;
	f=fopen("article.txt","r");
	while(fgets(b,sizeof(b),f)!=NULL)
	{
		strcpy(a[n],b);
		n++;
    }
	for(i=0;i<n;i++)
	{
		q=0;
		len=strlen(a[i]);
		for(j=0;j<len;j++)
		{
			if((a[i][j]>='a'&&a[i][j]<='z')||(a[i][j]>='A'&&a[i][j]<='Z'))
			{
				c[p][q]=a[i][j];
				q++;
			}
			else
			{
				p++;
				q=0;
			}
		}
	}
	for(i=0;i<p;i++)
	{
		len=strlen(c[i]);
		for(j=0;j<len;j++)
		{
			if(c[i][j]>='A'&&c[i][j]<='Z')
			c[i][j]=c[i][j]-'A'+'a';
		}
	}
	for(i=0;i<p;i++)
	{
		for(j=0;j<p-i-1;j++)
		{
			if(strcmp(c[j],c[j+1])>0)
			{
				char ch[MAX];
				strcpy(ch,c[j]);
				strcpy(c[j],c[j+1]);
				strcpy(c[j+1],ch);
			}
		}
	}
	int m=0;
	for(i=0;i<MAX;i++)
	num[i]=1;
	for(i=0;i<p;i++)
	{
		if(strcmp(c[i],c[i+1])!=0)
		{
			strcpy(d[m],c[i]);
			m++;
		}
		else num[m]++;
	}
	for(i=1;i<m;i++)
	{
		printf("%s %d\n",d[i],num[i]);
	}
	fclose(f);
	return 0;
}
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值