【数据结构】树结构实现词频统计

问题描述

编写程序统计一个英文文本文件中每个单词的出现次数(词频统计),并将统计结果按单词字典序输出到屏幕上。
要求:程序应用二叉排序树(BST)来存储和统计读入的单词。
注:在此单词为仅由字母组成的字符序列。包含大写字母的单词应将大写字母转换为小写字母后统计。在生成二叉排序树不做平衡处理。

输入

打开当前目录下文件article.txt,从中读取英文单词进行词频统计。

输出

程序应首先输出二叉排序树中根节点、根节点的右节点及根节点的右节点的右节点上的单词(即root、root->right、root->right->right节点上的单词),单词中间有一个空格分隔,最后一个单词后没有空格,直接为回车(若单词个数不足三个,则按实际数目输出)。
程序将单词统计结果按单词字典序输出到屏幕上,每行输出一个单词及其出现次数,单词和其出现次数间由一个空格分隔,出现次数后无空格,直接为回车。

样例

input

当前目录下文件article.txt内容如下:

“Do not take to heart every thing you hear.”
“Do not spend all that you have.”
“Do not sleep as long as you want;”

output

do not take
all 1
as 2
do 3
every 1
have 1
hear 1
heart 1
long 1
not 3
sleep 1
spend 1
take 1
that 1
thing 1
to 1
want 1
you 3

样例说明

程序首先在屏幕上输出程序中二叉排序树上根节点、根节点的右子节点及根节点的右子节点的右子节点上的单词,分别为do not take,然后按单词字典序依次输出单词及其出现次数。

代码

// frequency.cpp : 此文件包含 "main" 函数。程序执行将在此处开始并结束。
//

#include <iostream>
#include<fstream>
#include<algorithm>
#include<string>
#include<ctype.h>

using namespace std;

typedef int ElemType;

typedef struct TreeNode {
    int freq;
    string word;
    TreeNode* rchild;
    TreeNode* lchild;
}TreeNode;

TreeNode* InsertNode(string b, TreeNode* T) {
    if (T == NULL) {
        T = new TreeNode();
        T->word = b;
        T->freq++;
        T->lchild = NULL;
        T->rchild = NULL;
        return(T);
    }
    else if (b > T->word) {
        T->rchild = InsertNode(b, T->rchild);
    }
    else if (b < T->word) {
        T->lchild = InsertNode(b, T->lchild);
    }
    else if (b == T->word) {
        T->freq++;
    }
    return(T);

}

TreeNode* ReadFile(TreeNode* T) {

    fstream fin;
    fin.open("article.txt");
    if (!fin.is_open()) {
        cout << "Error";
        return T;
    }
    string a;
    while (!fin.eof()){
        string b = "";
        fin >> a;
        if (a != "") {
            for (int i = 0; i < a.length(); i++) {
                if (isalpha(a[i])) {
                    transform(a.begin(), a.end(), a.begin(), ::tolower);
                    b = b + a[i];
                }
                else {
                    if (b != "") {
                        T = InsertNode(b, T);
                        b = "";
                    }
                }//if
            }//for
            if (b != "") {
                T = InsertNode(b, T);
            }
        }
        a = "";
        
    } //while

    fin.close();
    return T;

}//ReadFile

void InOrderTravel(TreeNode* root)
{

    if (root == NULL)
        return;
    InOrderTravel(root->lchild);
    cout << root->word << " " << root->freq << endl;
    InOrderTravel(root->rchild);
}

void Delete(TreeNode* T) {

    if (T == NULL)
        return;
    
    Delete(T->lchild);
    Delete(T->rchild);
    delete(T);
}

int main()
{
    TreeNode* T = NULL;
    T = ReadFile(T);
    if (T->rchild->rchild != NULL) {
        cout << T->word << " " << T->rchild->word << " " << T->rchild->rchild->word << endl;
    }
    else if (T->rchild != NULL) {
        cout << T->word << " " << T->rchild->word << " " << endl;
    }
    else {
        cout << T->word << endl;
    }
    
    InOrderTravel(T);
    Delete(T);

}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值