词频统计

最新推荐文章于 2022-06-09 16:22:40 发布

是彤彤啊

最新推荐文章于 2022-06-09 16:22:40 发布

阅读量1.3k

点赞数 1

文章标签：数据结构

本文链接：https://blog.csdn.net/weixin_46226815/article/details/109393853

版权

【问题描述】

编写程序统计一个英文文本文件中每个单词的出现次数（词频统计），并将统计结果按单词字典序输出到屏幕上。

注：在此单词为仅由字母组成的字符序列。包含大写字母的单词应将大写字母转换为小写字母后统计。

【输入形式】

打开当前目录下文件article.txt，从中读取英文单词进行词频统计。

【输出形式】

程序将单词统计结果按单词字典序输出到屏幕上，每行输出一个单词及其出现次数，单词和其出现次数间由一个空格分隔，出现次数后无空格，直接为回车。

【样例输入】

当前目录下文件article.txt内容如下：

Do not take to heart every thing you hear.

Do not spend all that you have.

Do not sleep as long as you want;

【样例输出】

all 1

as 2

do 3

every 1

have 1

hear 1

heart 1

long 1

not 3

sleep 1

spend 1

take 1

that 1

thing 1

to 1

want 1

you 3

【样例说明】

按单词字典序依次输出单词及其出现次数。

【实现要求】

用数组或链表实现

【评分标准】

通过所有测试点将得满分。

#include <stdio.h>
#include <string.h>
#define MAX 101
char a[MAX][MAX];
char b[MAX]={0};
char c[MAX][MAX]; 
char d[MAX][MAX];
int num[MAX];
int main()
{
	FILE *f;
	int n=0,i,len,j,p=0,q=0;
	f=fopen("article.txt","r");
	while(fgets(b,sizeof(b),f)!=NULL)
	{
		strcpy(a[n],b);
		n++;
    }
	for(i=0;i<n;i++)
	{
		q=0;
		len=strlen(a[i]);
		for(j=0;j<len;j++)
		{
			if((a[i][j]>='a'&&a[i][j]<='z')||(a[i][j]>='A'&&a[i][j]<='Z'))
			{
				c[p][q]=a[i][j];
				q++;
			}
			else
			{
				p++;
				q=0;
			}
		}
	}
	for(i=0;i<p;i++)
	{
		len=strlen(c[i]);
		for(j=0;j<len;j++)
		{
			if(c[i][j]>='A'&&c[i][j]<='Z')
			c[i][j]=c[i][j]-'A'+'a';
		}
	}
	for(i=0;i<p;i++)
	{
		for(j=0;j<p-i-1;j++)
		{
			if(strcmp(c[j],c[j+1])>0)
			{
				char ch[MAX];
				strcpy(ch,c[j]);
				strcpy(c[j],c[j+1]);
				strcpy(c[j+1],ch);
			}
		}
	}
	int m=0;
	for(i=0;i<MAX;i++)
	num[i]=1;
	for(i=0;i<p;i++)
	{
		if(strcmp(c[i],c[i+1])!=0)
		{
			strcpy(d[m],c[i]);
			m++;
		}
		else num[m]++;
	}
	for(i=1;i<m;i++)
	{
		printf("%s %d\n",d[i],num[i]);
	}
	fclose(f);
	return 0;
}

是彤彤啊

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
词频统计

【问题描述】编写程序统计一个英文文本文件中每个单词的出现次数（词频统计），并将统计结果按单词字典序输出到屏幕上。注：在此单词为仅由字母组成的字符序列。包含大写字母的单词应将大写字母转换为小写字母后统计。【输入形式】打开当前目录下文件article.txt，从中读取英文单词进行词频统计。【输出形式】程序将单词统计结果按单词字典序输出到屏幕上，每行输出一个单词及其出现次数，单词和其出现次数间由一个空格分隔，出现次数后无空格，直接为回车。【样例输入】当前目录下文件article.txt内容如下：
复制链接

扫一扫