英语单词词频统计

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#define MAX_NUM 100000
struct//单词结构体
{
int num; //单词频数
char ch[20]; //每一个单词
 
}word[MAX_NUM];
 
void  read_e(char *essay,int *total_ch,char *ch)//获取文章信息
{
   FILE *fp;
   int i;
 
   fp=fopen("data.txt","r");
   if(!fp)
   {
   printf("\n打开文件data.txt失败!");
   exit(0);
 
   }
   //获取文章及总字符数
   
   (*ch)=fgetc(fp); //ch为文章第一个字符,判断文章文件是否为空。
 
 
   if(*ch!=EOF)
   {
   essay[0]=(*ch);
 
   for(i=1;!feof(fp);i++)
          essay[i]=fgetc(fp); //获取文章,将文章中的各个字符放到essay数组中
   essay[i]='\0'; //在读取文章时,并没有将字符串的结束标志读进去,为了后面使用strtok等字符串的相关函数,加上’\0’。
      (*total_ch)=strlen(essay);
   }
 
   fclose(fp);
 }
 
void show_e(char *essay,int *total_ch,char *ch) //显示文章
{
   if((*ch)==EOF)
          printf("\n文件为空,请选择文章续写!");
   else
   printf("%s",essay);
   printf("\n");
}
void sort(int *kind) //按照字典排序
{
int n,j,t;
char tempt[MAX_NUM];
for(n=0;n<(*kind)-1;n++)
   for(j=0;j<(*kind)-n-1;j++)
   {
   if(strcmp(word[j].ch,word[j+1].ch)==1)
   {
   strcpy(tempt,word[j].ch); //交换单词
   strcpy(word[j].ch,word[j+1].ch);
   strcpy(word[j+1].ch,tempt);
   t=word[j].num; //交换单词频数
   word[j].num=word[j+1].num;
   word[j+1].num=t;
   }
   }
 
}
void dep_show(char *essay,char *b)
{
int j,i=0;//i记录有多少不同的单词,n记录相同单词出现的次数
char *tok;
bool judge=false;
int sum=0;
FILE *fp;
    for(tok=strtok(essay,b);tok!=NULL;tok=strtok(NULL,b))
{
//利用strtok函数将文章中的单词分离开。
   sum++;//单词总数
   strcpy(word[i].ch,tok);
   (word[i].num)=1;
     /************************************************
 思想:
 统计单词频数主要是在
 函数void dep_show(char *essay,char *b)里实现。
 每分离一个单词将其复制到单词的结构体数组中
 并和之前统计的单词比较,若不相同,继续分离单词,
 将分离的单词复制到单词的结构体数组下一个元素中;
 若相同,则该单词的频数加1,继续分离单词,
 将分离的单词复制到单词的结构体数组上一次所得到
 的元素中,即覆盖了重复的单词。
 *************************************************/
   for(j=0;j<i;j++)
      if(strcmp(word[i].ch,word[j].ch)==0)
  {
      (word[j].num)++;
      judge=true;
  }
   if(judge)
   i--;
   i++;
   judge=false;
   }
 //  i=i-1;
   sort(&i);
   printf("单词总数为:%d\n",sum);
   fp=fopen("count.txt","w");
  
    if(!fp)
    {
   printf("\n打开文件count.txt失败!");
   exit(0);

   fprintf(fp,"单词总数为:%d\n",sum); //将单词总数读到文件中
   for(j=0;j<i;j++)
   {
   fprintf(fp,"%-16s\t%d\t\n",word[j].ch,word[j].num); //将单词、单词频数读到文件中
   printf("%-16s\t%d\t\n",word[j].ch,word[j].num); //将单词、单词频数打印到屏幕上
   }
    fclose(fp);
  }
 
 
 
 
void add(char *essay,int *total_ch,char *ch)
{
    char essay_write[MAX_NUM];
   FILE *fp;
    char str=' ';
   getchar();
   fp=fopen("data.txt","a+");
    if(!fp)
    {
      printf("\n打开文件data.txt失败!");
     exit(0);
    }
    printf("请输入:");
    gets(essay_write);
   if((*ch)!=EOF)
   fputc(str,fp);
   fputs(essay_write,fp); //将新增的文章读到文件上
 
   strcat(essay,essay_write);
    read_e(essay,total_ch,ch);
    
   printf("添加成功");
    printf("\n");
    fclose(fp);
 }
void menu(int *select)
{
  int item,total_ch=0;//total_ch记录文章中的总字符数
  char b[]={',','.','?',':','-',' ','  '},essay[2*MAX_NUM],ch;
  printf("\n");
  printf("----------------------------------------------------------------------\n");
  printf(" 英语文本词频统计              \n");
  printf(" 1.文章续写                        2.显示英文文本    \n");
  printf(" 3.显示单词总数、全部单词及频数    4.退出 \n");
  printf("-----------------------------------------------------------------------\n");
  printf("请选择1~4:");
  scanf("%d",&item);
  printf("\n");
  read_e(essay,&total_ch,&ch);
  switch(item)
  {
      case 1:add(essay,&total_ch,&ch);break;
      case 2:show_e(essay,&total_ch,&ch);break;
      case 3:dep_show(essay,b);break;
      case 4:select=0;break;
      default:printf("请在1~4之间选择\n");break;
   }
}
void main()
{   int select=1;
   while(select)
   {
     menu(&select);
   }
}
  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Aimee_mf

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值