BUAA词频统计（树实现）

最新推荐文章于 2023-12-11 21:39:26 发布

VIP文章 star-399

最新推荐文章于 2023-12-11 21:39:26 发布

阅读量2.4k

点赞数 7

分类专栏： BUAA数据结构文章标签： c语言数据结构

本文链接：https://blog.csdn.net/weixin_45927469/article/details/107008051

版权

【问题描述】

编写程序统计一个英文文本文件中每个单词的出现次数（词频统计），并将统计结果按单词字典序输出到屏幕上。

要求：程序应用二叉排序树（BST）来存储和统计读入的单词。

注：在此单词为仅由字母组成的字符序列。包含大写字母的单词应将大写字母转换为小写字母后统计。在生成二叉排序树不做平衡处理。

【输入形式】

打开当前目录下文件article.txt，从中读取英文单词进行词频统计。

【输出形式】

程序应首先输出二叉排序树中根节点、根节点的右节点及根节点的右节点的右节点上的单词（即root、root->right、root->right->right节点上的单词），单词中间有一个空格分隔，最后一个单词后没有空格，直接为回车（若单词个数不足三个，则按实际数目输出）。

程序将单词统计结果按单词字典序输出到屏幕上，每行输出一个单词及其出现次数，单词和其出现次数间由一个空格分隔，出现次数后无空格，直接为回车。

【样例输入】

当前目录下文件article.txt内容如下：

“Do not take to heart every thing you hear.”

“Do not spend all that you have.”

“Do not sleep as long as you want;”

【样例输出】

do not take

all 1

as 2

do 3

every 1

have 1

hear 1

heart 1

long 1

not 3

sleep 1

spend 1

take 1

that 1

thing 1

to 1

want 1

you 3

【样例说明】

程序首先在屏幕上输出程序中二叉排序树上根节点、根节点的右子节点及根节点的右子节点的右子节点上的单词，分别为do not take，然后按单词字典序依次输出单词及其出现次数。

方法一

#include <stdio.h>
#include <math.h>
#include <string.h>
#include <stdlib.h>
#include <ctype.h>
#include <math.h>

typedef struct node
{
   
    char word[20];
    int num;
    struct node *lchild, *rchild;
} Tree;
Tree *temp, *tempp, *root = NULL, *add = NULL;

Tree *New(char w[]);
Tree *PTFT(Tree *root);

int main()
{
   
    char ch;
    FILE *fp;
    fp = fopen("article.txt", "r+");
    ch = fgetc(fp);
    while (ch != EOF)
    {
   
        char s[20] = {
   0};
        if ((ch <= 'z' && ch >= 'a') || (ch <= 'Z' && ch >= 'A'))
        {
   
            if (ch <= 'Z' && ch >= 'A')
                ch = ch + 32;
            s[0] = ch;
            for (int i = 1; i < 20; i++)
            {
   
                ch = fgetc(fp);
                if (ch <= 'Z' && ch >= 'A')
                {
   
                    ch = ch +

最低0.47元/天解锁文章

star-399

关注

7
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
BUAA词频统计（树实现）

【问题描述】编写程序统计一个英文文本文件中每个单词的出现次数（词频统计），并将统计结果按单词字典序输出到屏幕上。要求：程序应用二叉排序树（BST）来存储和统计读入的单词。注：在此单词为仅由字母组成的字符序列。包含大写字母的单词应将大写字母转换为小写字母后统计。在生成二叉排序树不做平衡处理。【输入形式】打开当前目录下文件article.txt，从中读取英文单词进行词频统计。【输出形式】程序应首先输出二叉排序树中根节点、根节点的右节点及根节点的右节点的右节点上的单词（即root、root->
复制链接

扫一扫