字典树学习与使用

最新推荐文章于 2023-08-24 12:30:21 发布

zpfnevergiveup

最新推荐文章于 2023-08-24 12:30:21 发布

阅读量258

点赞数

分类专栏： C语言数据结构文章标签： nyoj290 Trie树树形结构字典树

本文链接：https://blog.csdn.net/zpf_nevergiveup/article/details/78247241

版权

C语言同时被 2 个专栏收录

20 篇文章 0 订阅

订阅专栏

数据结构

12 篇文章 0 订阅

订阅专栏

动物统计加强版

时间限制： 3000 ms | 内存限制： 150000 KB

难度： 4

描述

在美丽大兴安岭原始森林中存在数量繁多的物种，在勘察员带来的各种动物资料中有未统计数量的原始动物的名单。科学家想判断这片森林中哪种动物的数量最多，但是由于数据太过庞大，科学家终于忍受不了，想请聪明如你的ACMer来帮忙。

输入

第一行输入动物名字的数量N(1<= N <= 4000000),接下来的N行输入N个字符串表示动物的名字（字符串的长度不超过10,字符串全为小写字母，并且只有一组测试数据）。

输出

输出这些动物中最多的动物的名字与数量，并用空格隔开（数据保证最多的动物不会出现两种以上）。

样例输入

10
boar
pig
sheep
gazelle
sheep
sheep
alpaca
alpaca
marmot
mole

样例输出

sheep 3

来源

[陈玉张云聪]原创

上传者

陈玉

字典树：

又称单词查找树，Trie树，是一种树形结构，是一种哈希树的变种。典型应用是用于统计，排序和保存大量的字

符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。

它的优点是：利用字符串的公共前缀来减少查询时间，最大限度地减少无谓的字符串比较，查询效率比哈希树高。

参考图（如下）：count与max的比较，count记录的是每一个子串出现的次数，然后进行比较，方便理解就用字母

代替key，程序中是 k=s[i] - 'a',将k的值通过asccii码，将字母转化为数字0到25

#include<stdio.h>
#include<string.h>
#include<algorithm>
struct node{
    node *next[26];   //指向下一个节点，为什么是26个因为每一层字典数最多从'a' 到 'z'
    int count; //记录个数
    node(){
        memset(next,0,sizeof(next));
        count=0;
    }
};

int max=0;
char ret[20];
//新建一个对象
node *root = new node();
int k;
void insert(char *s){  //插入新的字符串
    node *p = root; //每次都要从头开始寻找
    int len = strlen(s);
    for (int i=0;i<len;i++){
        k=s[i]-'a';
        if(p->next[k]==NULL){
            p->next[k]=new node();
        }
        //如果存在则将指针后移，如果不存在新建然后将指针后移
        p=p->next[k];
    }
    p->count++;
    if(p->count>max){
        max = p->count;
        strcpy(ret,s);
    }
}

int main(){
    int n;
    scanf("%d",&n);
    char s[20];
    for (int i=0;i<n;i++){
        scanf("%s",s);
        //传入输入的字符串
        insert(s);
    }
    //输出max和ret
    printf("%s %d\n",ret,max);
}