FST结构（解决Trie前缀树后边不能复用的问题）

最新推荐文章于 2024-07-03 19:13:37 发布

肥春勿扰

最新推荐文章于 2024-07-03 19:13:37 发布

阅读量192

点赞数

分类专栏： es 文章标签： java 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52988841/article/details/132700289

版权

es 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

能力有限看图理解把。以下的图值得反复琢磨

常用的字典的数据结构

hashmap skip list Trie前缀树 FST

Trie前缀树

Trie：相邻有序的term更又可能具有相同的前缀值，那么通过前缀存储就可以节省存储空间

但是你会发现后缀也重复，但是前缀树无法满足后缀也复用

FST 有限状态转换器（编译原理学过的）

FSM(Finite State Machines)有限状态机: 表示有限个状态集合以及这些状态之间转移和动作的数学模型。其中一个状态被标记为开始状态，0个或更多的状态被标记为final状态

FSA：有限状态接收机

这样输入最后一个就变成了这样

确定性:在任何给定状态下，对于任何输入，最多只能遍历一个transtion
非循环:不可能重复遍历同一个状态
Final唯一性:当且仅当有限状态机在输入序列的末尾处于最终状态时，才接受特定的输入序列
以上例子，如果输入‘wl’会怎样？其实就是可以搜索到的了。因为l指向的节点3已经是final节点了。为解决这样的问题，引出FST

FST简述及它的查询过程

FST:有限状态转化机

FST最重要的功能是可以实现key到value的映射，相当于HashMap<K,V>。FST的查询速度比hashMap慢一点，但是内存消耗比hashMap小很多。FST在lucene大量使用:倒排索引的存储，同义词词典的存储，搜索关键字建议等等。
对于es来说，它是基于lucence开发，底层的数据结构使用的就是fst,它的主要优点:

    查询快
    极致压缩空间占用
    特性:
    确定性:在任何给定状态下，对于任何输入，最多只能遍历一个transtion
    非循环:不可能重复遍历同一个状态
    transducer: 转化器有相关的值(payload),final节点会输出一个值
    比起前面的前缀树以及FSA，在存储的时候多了一个value值。
    考虑以下输入字符:

后边那个其实就是他的出度。

看上边那个过程，当你的出度满足你所需的出度的时候才算匹配成功。就比如wi去匹配的时候就匹配不到了。我们加了一个value 和Finaloutput

能力有限看图理解把。以上的图值得反复琢磨

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
FST结构（解决Trie前缀树后边不能复用的问题）

hashmap skip list Trie前缀树 FST。
复制链接

扫一扫

专栏目录

肥春勿扰 CSDN认证博客专家 CSDN认证企业博客

码龄4年

101: 原创

110万+: 周排名

26万+: 总排名

3万+: 访问

: 等级

1102: 积分

23: 粉丝

73: 获赞

21: 评论

79: 收藏

私信

关注

热门文章

分类专栏

工作相关
spring 8篇
idea 1篇
java 14篇
netty 2篇
es 5篇
并发 9篇
redis 10篇
leetcode 3篇
mysql 7篇
设计模式 2篇
jvm 2篇
java性能调优 1篇
Rpc 1篇
微服务 3篇
AI作业 10篇
数据结构
bug 2篇

最新评论

深入AQS原理(我在一开始学的时候就把非公平锁和公平锁给弄混了)
Ahshsjshbb: 你好，可以详细解释一下condition demo的情况吗根据文中总结 Condition有类似于await的机制，因此不会产生加锁方式而产生的死锁出现，同时底层实现的是park/unpark的机制，因此也不会产生先唤醒再挂起的死锁，一句话就是不会产生死锁但是如果在线程1的lock.lock()方法调用前使用Thread.sleep等延时操作，这样就会让线程2先执行，我实际操作了一边，线程1还是会被阻塞在await那一行代码中不会跳出来呀
线程转换状态，傻傻分不清等待和阻塞吗？你还在暴力的停止线程吗？
&如歌的行板&: 我感觉阻塞和等待在CPU切片的维度上更好的理解。通俗来说，阻塞状态就是CPU时间片即使轮到你执行，你也不能执行。比如等到锁这个。等待呢就是CPU时间片轮到你执行的时候你就可以执行了。这样理解更容易区分，不知道对不对
spring 的循环依赖以及spring为什么要用三级缓存解决循环依赖
肥春勿扰: 关注一下我的其他作品you
spring 的循环依赖以及spring为什么要用三级缓存解决循环依赖
肥春勿扰: 不能被解决
spring 的循环依赖以及spring为什么要用三级缓存解决循环依赖
雨水安居: 只有单例模式下的循环依赖问题不会报错吗，多例模式的循环依赖可以解决吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。