统计文本中单词出现次数,打印出现次数最多的前10个.文本大小30KB~300KB

统计文本中单词出现次数,打印出现次数最多的前10个.文本大小30KB~300KB

一。编译环境

      1). 操作系统:Windows8.1

      2). IDE: VS2012

      3). 语言: C++,MFC框架

     另外....简单的用Skin#美化了一下界面皮肤 

二。基本思想

        使用文件流读取文件,去掉标点,空格用以分隔单词,每读取一个单词就存入map的key和value,若存在则将相应的key对应的value值(即该单词出现次数)加1。(注明:这里利用map操作时insert时相同的key不会被覆盖,但是利用下标访问表达式,map[key] =value;这样的调用是会被重写相应key的值的。这样做可以省去很多代码)

三。重要部分代码

     注释已经算很详细了吧,由于MFC框架的关系,就只贴出关键部分代码。

这里利用复选框来选择需不需要排除"am","is","are","i","you","he","she","and"...由于这些词太多,我也就选一些特别容易出现的作为代表。文件的选择利用文件对话框自行选择。

     以下为“检测”按钮点击事件:

void CStringCatcherDlg::OnBnClickedScan()
{
	//获得复选框的选中状态
	CButton* pBtn = (CButton*)GetDlgItem(IDC_CHECK);   //获取复选框指针
	int state = pBtn->GetCheck();                      //取得选中状态
	
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
```c #include <stdio.h> #include <stdlib.h> #include <string.h> #include <ctype.h> #define MAX_WORD_LEN 100 // 最大单词长度 #define TOP_N 10 // N个出现次数最多的单词 // 单词结构体 typedef struct { char word[MAX_WORD_LEN]; // 单词 int count; // 出现次数 } Word; // 比较函数,用于qsort排序 int cmp(const void *a, const void *b) { return ((Word *)b)->count - ((Word *)a)->count;} int main() { char filename[100]; // 文件名 printf("请输入文件名:"); scanf("%s", filename); FILE *fp = fopen(filename, "r"); // 打开文件 if (fp == NULL) { printf("文件打开失败!\n"); return 0; } Word *words = (Word *)malloc(sizeof(Word) * 1000); // 动态分配内存 int wordCount = 0; // 单词数量 char word[MAX_WORD_LEN]; // 临时存储单词 int len = 0; // 单词长度 char c; // 临时存储字符 while ((c = fgetc(fp)) != EOF) { // 逐个字符读取文件 if (isalpha(c)) { // 如果是字母 if (len < MAX_WORD_LEN - 1) { // 如果单词长度未超过最大长度 word[len++] = tolower(c); // 转换为小写字母并存储 } } else if (len > 0) { // 如果不是字母且单词长度大于0 word[len] = '\0'; // 添加字符串结束符 int i; for (i = 0; i < wordCount; i++) { // 查找单词是否已存在 if (strcmp(words[i].word, word) == 0) { // 如果已存在 words[i].count++; // 出现次数加1 break; } } if (i == wordCount) { // 如果不存在 strcpy(words[wordCount].word, word); // 存储单词 words[wordCount].count = 1; // 出现次数为1 wordCount++; // 单词数量加1 } len = 0; // 重置单词长度 } } fclose(fp); // 关闭文件 qsort(words, wordCount, sizeof(Word), cmp); // 按出现次数排序 printf("出现次数%d的单词:\n", TOP_N); int i; for (i = 0; i < TOP_N && i < wordCount; i++) { // 输出N个单词 printf("%s\t%d\n", words[i].word, words[i].count); } free(words); // 释放内存 return 0; } ``` --相关问题--: 1. 如何统计一个文本文件出现次数最多的十个汉字

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值