对文件进行筛选c语言,用c语言实现文本文件中的字符筛选分析。

近期遇到这样一个问题:写一个程序,分析一个文本文件(英文文章)中各个词出现的频率,并且把频率最高的10个词打印出来。

解决这个问题我认为要解决这样几个问题:

1)如何实现文本文件中数据的有效读取;(这个本人对文件操作不太熟练,所以单独拿出来当做一个问题)

2)如何从读出的数据中分析出一个一个的单词;

3)如何累计计算出每个单词的出现次数;

4)如何为每词出现的次数排序,打印出出现次数前10的单词;

5)算法的效率问题,即对整个文本文件中数据的遍历次数;

初步代码如下:

#include

#include

#include

#define

MAX 1000000

void main(){

struct Word{

char

word_str[20];

int mount;

}word[MAX],temp;

FILE

*fp;

char ch;

int

flag=0;//指示前一个字符是不是非英文字母字符,前一个字符是非英文字母置flag=0,不是非英文flag=1

int

i=0,j=0,k=0;//计数

for(i=0;i

word[i].mount=0;

}

i=0;

if((fp=fopen(".\\eng.txt","r+"))==NULL){

printf("无法打开此文件");

exit(0);

}

while(ch!=EOF){//这里对于处理最后一个符号不是非英文字母的文章有bug,有改进空间

ch=fgetc(fp);

if(((ch>=‘a‘&&ch<=‘z‘)||(ch>=‘A‘&&ch<=‘Z‘))!=0){

flag=0;

i++;

j=0;

for(k=0;k

if(strcmp(word[i-1].word_str,word[k].word_str)==0){

word[k].mount++;

i=i-1;

break;

}

}

}

else{

flag=1;

word[i].word_str[j]=ch;

word[i].word_str[j+1]=‘\0‘;

j++;

}

}

fclose(fp);

for(k=0;k<=i-1;k++){

for(j=k+1;j<=i-1;j++){

if(word[k].mount

temp=word[k];

word[k]=word[j];

word[j]=word[k];

}

}

}

printf("下面输出使用频率最高的10个单词(相等频率超出10个不计)\n");

for(k=0;k<10;k++){

printf("%s

\n",word[k].word_str);

}

}

运行没有错误,但是不出结果,很是郁闷。3个小时的成果,也就这样。下周继续吧。

然后希望有编程高手大大指点一下O.o (如果您有时间想指点小子,请联系qq:1766388993)

TO BE CONTINUED...

原文:http://www.cnblogs.com/stduyangbo/p/3562074.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值