【C语言】词频统计+按频率降序输出_编写一个程序,根据单词的出现频率降序打印出所输入的的各个单词。每个单词前标有-CSDN博客

本文链接：https://blog.csdn.net/qq_46595470/article/details/128000375

#include<stdio.h>
#include<string.h>
#include<stdlib.h>
#include<ctype.h>
typedef struct{
	char word[255];
	int cnt; //本单词出现的次数
}Str;

int count=0; //全局变量，统计单词的总个数 用于计算概率

//a=b 返回0  a<b 返回负值 a>b 返回正值
int comp(const void *a, const void *b){//cmp函数的返回值，<0(不进行置换)，>0(进行置换)，0(不进行置换)
	return ((Str*)a)->cnt - ((Str*)b)->cnt;
}

int main(){
	char word[255];//存放单个单词
	char s[2048];//存放输入的文本 方法1：在这里直接给文本
	Str stas[1000];//存放统计的单词和个数
	int i=0,j=0,k=0;//i：遍历整段文本 j：给单个word[]赋值用 k：遍历stas[]中已经统计的单词
	//i必须为0
	int rear=0;//指向stas[]的下标

	//方法2：键盘输入
//	char ch;
//	while ((ch = getchar()) != '\n'){
//		s[i++] = ch;
//	}
//	s[i]='\0';//别忘了手动给尾巴 不然没法判断结束
	//方法3：文件读入
//	FILE* fp=fopen("test.txt","r");
//    if(fp==NULL){
//        printf("can not open file");
//        exit(0);
//    }
//    fgets(s,10000,fp);
//    fclose(fp);
	
	i=0;
	while(s[i]){//遍历整段文本
		j=0;//注意 这句不能省 因为每次word都是重新开始赋值
		while (isalpha(s[i])){//是字母 接下来按单词处理
		//错误做法：在这里直接总词数++了
			word[j] = s[i];
			i++;j++;
		}
		word[j] = '\0';//一个单词找完了 给个尾巴
		for(k=0; k<rear; k++){//遍历stas[]看该单词存在过与否
			if(strcmp(word, stas[k].word)==0){//如果这个单词不是第一次出现
				stas[k].cnt++; //该单词出现的次数++
				count++;//每次单词++总词数就++
				break; //跳出for循环
			}
		}
		if(k==rear){//如果是新单词
			if (word[0]!='\0'){//把这个新单词加入到stas[]里
				strcpy(stas[rear].word,word);//注意字符串不能直接赋给另一个变量 要copy
				stas[rear].cnt++;
				count++;
				rear++;
			}
		}
		
		while (!isalpha(s[i])){//不是字母
			if (s[i] == '\0')//特殊：如果是尾巴就告诉大循环 然后一起跳出
				break;
			i++;//正常：不是字母就继续往下找
		}
	}

	qsort(stas, rear, sizeof(Str), comp); //qsort默认是从小到大排序

	for(i=rear-1; i>=0; i--){ //从大到小输出单词、单词出现的次数、词频
		printf("%s\t%d\t%.2f\n", stas[i].word, stas[i].cnt, (float)stas[i].cnt/count);
	}

	return 0;
}