浅谈Trie树(字典树)

定义:Trie,又称字典树,是一种用于实现字符串快速检索的多叉树结构。Trie的每个节点都拥有若干个字符指针,若在插入或检索字符串时扫描到一个字符\(c\),就沿着当前节点的\(c\)这个字符指针,走向该指针指向的节点。


基本特点

  • 每条树边上仅包含一个字符
  • 从根节点到某一个节点,路径上经过字符顺次连接形成的串,为该节点对应的字符串
  • 每个节点对应的字符串各不相同,且一定为给定字典中某个串的前缀

初始化:一颗空Trie树仅包含一个节点,该点的字符指针均指向空


插入:当需要插入一个字符串\(s\)时,我们令一个指针\(p\)起初指向根节点。然后,依次扫描\(s\)中的每个字符\(c\):

  • \(p\)\(c\)字符指针指向一个已经存在的节点\(Q\),则令\(p=Q\)。(即\(c\)字符指针匹配到了相同的字符)
  • \(p\)\(c\)字符指针指向空,则新建一个节点\(Q\),令\(p\)\(c\)字符指针指向\(Q\),然后令\(p=Q\)(即\(c\)字符指针没有匹配到相同的字符)

\(s\)中的字符扫描完毕时,若当前节点\(p\)被标记为一个字符串的末尾,则说明\(s\)在Trie树中存在,否则说明\(s\)没有被插入过Trie。

检索:当需要检索一个字符串\(s\)在Trie树中是否存在时,我们令一个指针\(p\)起初指向根节点,然后依次扫描\(s\)中的每个节点\(c\)

  • \(p\)\(c\)指针指向空,则说明\(s\)没有被插入过Trie,结束检索
  • \(p\)\(c\)字符指针指向一个已经存在的节点\(Q\),则令\(p=Q\)
    \(s\)中的字符扫描完毕时,若当前节点\(p\)被标记为一个字符串的末尾,则说明\(s\)在Trie中存在,否则说明\(s\)没有被插入过Trie。

字符串集{A,i,inn,to,tea,ted,ten}的Trie树如下:
SouthEast

上图中红色标记了单词的末尾节点。可以看出Trie中,字符数据都体现在树的边(指针)上,树的节点仅保存一些额外信息,例如单词结尾标记等。其空间复杂度是\(O(NC)\)


代码实现

int tot=1;
bool end[4*maxn];
int trie[4*maxn][26];
void ins(char *str)
{
    int len=strlen(str),p=1;
    for(int i=0;i<len;i++)
    {
        int ch=str[i]-'a';
        if(!trie[p][ch])trie[p][ch]=++tot;
        p=trie[p][ch];
    }
    end[p]=true;
}
int search(char *str)
{
    int len=strlen(str),p=1;
    for(int i=0;i<len;i++)
    {
        p=trie[p][str[i]-'a'];
        if(!p)return false;
    }
    return end[p];
}

转载于:https://www.cnblogs.com/Luvwgyx/p/8418704.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值