#include
#include
#define N 50
typedef struct BiTNode //定义结构体
{
char data[N];
int count;
struct BiTNode *lChild; //左子树
struct BiTNode *rChild; //右子树
}BiTNode,*BiTree;
int GetWord(int start,int end,char* pBuf,char* word); //定义词汇
void CreateSearchTree(char* item,BiTree& T); //创建二叉树进行查找
void InOrderAndPrint(BiTree T,FILE* pf); //进行中序遍历查找并写入文件
int sum=0;
char temp1[N];
char temp2[N];
int GetWord(int start,int end,char* pBuf,char* word) //词汇
{
int i;
int j=0;
memset(word,0,sizeof(char));
for(i=start;i<end;i++)
{
if(isalpha(pBuf[i])) //判断单词
{
word[j]=pBuf[i]; //判断字符ch是否为英文字母,若为英文字母,返回非0
j++;
}
else
{
if(j==0)
{
continue;
}
word[j]=’\0’;
j=0;
sum++;
break;
}
}
return i;
}
void CreateSearchTree(char* item,BiTree& T) //创建二叉树进行查找
{
strcpy(temp1,item); //把字符串item中的内容copy到temp1中
temp1[0]=tolower(item[0]);
if(T==NULL)
{
T=(BiTree)malloc(sizeof(BiTNode)); //动态内存分配
strcpy(T->data,item);
T->count=1;
T->lChild=NULL;
T->rChild=NULL;
}
else
{
strcpy(temp2,T->data); //把字符串temp2中的内容copy到temp1中
temp2[0]=tolower(T->data[0]); //把字母字符转换成小写
if(strcmp(temp1,temp2)==-1) //比较两个字符串
{
CreateSearchTree(item,T->lChild);
}
else if(strcmp(temp1,temp2)==1) 若temp1>temp2,则返回正数
{
CreateSearchTree(item,T->rChild);
}
else
{
T->count++;
}
}
}
void InOrderAndPrint(BiTree T,FILE* pf) //进行中序遍历查找并写入文件
{
if(T!=NULL)
{
InOrderAndPrint(T->lChild,pf);
fprintf(pf,“出现的词汇:%-30s 频率:%-9d\t\n”,T->data,T->count);
printf(“出现的词汇:%-30s 频率:%-9d\t\n”,T->data,T->count);
InOrderAndPrint(T->rChild,pf);
}
}
int main()
{ while(1){ //获取输入文件名
char fileName[30];
memset(fileName,0,sizeof(fileName)); //若temp1>temp2,则返回正数
printf(“请输入查找的文件名(例:test.txt): “);
scanf(”%s”,fileName);
FILE* pf; //打开需要统计词汇的文件
pf=fopen(fileName,“rb”);
if(pf==NULL)
{
printf(“找不到文件!无法打开文件\n”);
return false;
}
printf("* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * \n");
printf(“成功打开文件— %s !\n\n”,fileName);
printf("* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * \n");
fseek(pf,0,SEEK_END); //读取文件
int len=ftell(pf);
rewind(pf);
char *pBuf=new char[len+1];
pBuf[len]=0;
fread(pBuf,1,len,pf);
fclose(pf);
printf("%s\n",pBuf); //读取单词
printf("*****************************************************************************\n\n");
int i=0;
char word[N];
BiTree T=NULL; //二叉树进行判断
while(i<len)
{
i=GetWord(i,len,pBuf,word);
if(strlen(word)0)
{
break;
}
CreateSearchTree(word,T);
}
memset(fileName,0,sizeof(fileName)); //写入文件并显示在屏幕上
printf(“请输入写出文件名 : “);
scanf(”%s”,fileName);
pf=fopen(fileName,“w”);
if(pfNULL)
{
printf(“不能写入文件!”);
return false;
}
printf("******************************************************************************\n");
fprintf(pf,"\t\t词频统计结果: \n");
printf("\t\t词频统计结果:\n");
fprintf(pf,"*********************************************************\n");
InOrderAndPrint(T,pf);
fprintf(pf,"*********************************************************\n");
fprintf(pf,"这篇文章单词总数: %d\n",sum);
printf("这篇文章单词总数:%d\n",sum);
fclose(pf);
printf("******************************************************************************\n");
printf("统计结果写入文件 --- %s !\n\n",fileName);
}
return 0;
}