【C语言】词频统计+按频率降序输出

#include<stdio.h>
#include<string.h>
#include<stdlib.h>
#include<ctype.h>
typedef struct{
	char word[255];
	int cnt; //本单词出现的次数
}Str;

int count=0; //全局变量,统计单词的总个数 用于计算概率

//a=b 返回0  a<b 返回负值 a>b 返回正值
int comp(const void *a, const void *b){//cmp函数的返回值,<0(不进行置换),>0(进行置换),0(不进行置换)
	return ((Str*)a)->cnt - ((Str*)b)->cnt;
}

int main(){
	char word[255];//存放单个单词
	char s[2048];//存放输入的文本 方法1:在这里直接给文本
	Str stas[1000];//存放统计的单词和个数
	int i=0,j=0,k=0;//i:遍历整段文本 j:给单个word[]赋值用 k:遍历stas[]中已经统计的单词
	//i必须为0
	int rear=0;//指向stas[]的下标

	//方法2:键盘输入
//	char ch;
//	while ((ch = getchar()) != '\n'){
//		s[i++] = ch;
//	}
//	s[i]='\0';//别忘了手动给尾巴 不然没法判断结束
	//方法3:文件读入
//	FILE* fp=fopen("test.txt","r");
//    if(fp==NULL){
//        printf("can not open file");
//        exit(0);
//    }
//    fgets(s,10000,fp);
//    fclose(fp);
	
	i=0;
	while(s[i]){//遍历整段文本
		j=0;//注意 这句不能省 因为每次word都是重新开始赋值
		while (isalpha(s[i])){//是字母 接下来按单词处理
		//错误做法:在这里直接总词数++了
			word[j] = s[i];
			i++;j++;
		}
		word[j] = '\0';//一个单词找完了 给个尾巴
		for(k=0; k<rear; k++){//遍历stas[]看该单词存在过与否
			if(strcmp(word, stas[k].word)==0){//如果这个单词不是第一次出现
				stas[k].cnt++; //该单词出现的次数++
				count++;//每次单词++总词数就++
				break; //跳出for循环
			}
		}
		if(k==rear){//如果是新单词
			if (word[0]!='\0'){//把这个新单词加入到stas[]里
				strcpy(stas[rear].word,word);//注意字符串不能直接赋给另一个变量 要copy
				stas[rear].cnt++;
				count++;
				rear++;
			}
		}
		
		while (!isalpha(s[i])){//不是字母
			if (s[i] == '\0')//特殊:如果是尾巴就告诉大循环 然后一起跳出
				break;
			i++;//正常:不是字母就继续往下找
		}
	}

	qsort(stas, rear, sizeof(Str), comp); //qsort默认是从小到大排序

	for(i=rear-1; i>=0; i--){ //从大到小输出单词、单词出现的次数、词频
		printf("%s\t%d\t%.2f\n", stas[i].word, stas[i].cnt, (float)stas[i].cnt/count);
	}

	return 0;
}

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值