C语言:文本中不同单词频率

本文介绍了如何使用C语言统计文本中不同单词的出现频率。通过利用英文单词间的空格间隔,采用fscanf函数逐个读取单词,并用链表存储,实现对文本单词计数的改进方法。
摘要由CSDN通过智能技术生成

c语言统计文本中不同单词频率

标准英文文章中两个单词间即使有标点符号,也会存在空格,所以可用空格区分单词,可用fscanf函数特性,一次读取一个单词

  • 此为改进版(运用链表存储)
#include<stdio.h>
#include<ctype.h>
#include<string.h>
#include<stdlib.h>
typedef struct word{
	char wrd[20];
	struct word *next;
	int num;
}word;
static int total_words=0;   //单词总数
static int diff_words=0;	//不同单词个数
void insert(word * const head,char *s,int size)
{
	word *cur;
	word *newwrd;
	total_words++;  
	if (!isalpha(s[size-1]))   //因为最后一个字母可能是标点符号,所以去掉
		s[size-1]='\0';
	cur=head->next;
	while (cur!=NULL)    //遍历链表
	{
		if (!strcmp(cur->wrd,s))   //若链表中已存在,num++,并结束此函数
		{
			cur->num++;
			return;
		}
		cur=cur->next;
	}
	newwrd=(word*)malloc(sizeof(word));   //执行到这里说明没有找到相同单词,执行头插法
	newwrd->num=1;
	strcpy(newwrd->wrd,s);
	newwr
  • 2
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值