文本检索算法

纯C语言实现。

这个函数的功能是检索文件中的单词,并定位到那一行,并输出出现数目。

算法感觉难度不是特别大,但我这个算法效率并不高,准备以后写个效率更高的。

函数的第二个参数可以删除,在这里并没有什么用。

void word_count(FILE *file,int *line_no,char *word)   //统计单词所在行及其所在行数的数目
{
 int word_num=0;   //记录单词的数目
 int line_num=0;   //统计行号
 int i=0,j=0;   //用于循环控制
 int k=0;
 int word_sum=0;   //记录单词总数
 char line[LINESIZE]; //存储一行的单词
 char temp[WORDSIZE]; //存储一行中要比较的单词
 
 fseek( file , 0 , SEEK_SET );  //因为可能多次调用该函数,每次都将指针定位到文件头部
 while(fgets(line,LINESIZE,file))
 {
  for(i=0;i<=strlen(line);i++)
  {
   if(line[i]==' '||line[i]==','||line[i]==' .'||line[i]=='\n'||line[i]=='\0') 
   {
    for(;j<i;j++)
    {
     if((line[j]>='a'&&line[j]<='z')||(line[j]>='A'&&line[j]<='Z'))  //文本中出现的特殊字符的过滤
     {
      if(line[j]>='A'&&line[j]<='Z')   //忽略大小写,大写和小写都视作相同单词
       temp[k++]=line[j]+32;
      else
       temp[k++]=line[j];
     }
    }
    temp[k]='\0';
    j=i+1;
    k=0;
    if(strcmp(word,temp)==0)   //比较单词是否相同
     word_num++;
   }
  }
  j=0;
  line_num++;
  
  word_sum+=word_num;
  if(word_num!=0)
   printf("%s出现行号%d,出现次数为%d\n%s",word,line_num,word_num,line);
  word_num=0;
 }
 printf("%s总数为%d\n",word,word_sum);
}

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值