ElasticSearch篇
文章平均质量分 61
学习 ElasticSearch
wupanP
这个作者很懒,什么都没留下…
展开
-
能说说ElasticSearch 写索引的逻辑吗?
ElasticSearch 的写索引逻辑涉及多个步骤,从数据写入到内存缓冲区(buffer),再到刷新到磁盘,最后进行段合并(segment merging)。原创 2024-08-06 16:26:01 · 785 阅读 · 0 评论 -
了解文本相似度 TF-IDF吗
简单地说,就是你检索一个词,匹配出来的文章,网页太多了。比如 1000 个,这些内容再该怎么。呈现,哪些在前面哪些在后面。这需要也有个对匹配度的评分。TF-IDF 就是干这个的。原创 2024-08-06 15:56:03 · 111 阅读 · 0 评论 -
谈谈你对段合并的策略思想的认识
段合并策略决定了何时以及如何将多个小段合并成一个更大的段。原创 2024-08-06 15:49:01 · 115 阅读 · 0 评论 -
说说分段存储的思想
早期的搜索引擎系统确实通常是为整个文档集合建立一个大的倒排索引。为了解决这些问题,现代搜索引擎(如 ElasticSearch)采用了分段存储(Segment Storage)的策略,将一个大的索引文件拆分为多个独立的子文件,每个子文件称为一个段(segment)。原创 2024-08-06 15:39:48 · 405 阅读 · 0 评论 -
谈谈ElasticSearch中分词与倒排索引的原理
ElasticSearch 是一个分布式搜索和分析引擎,其高效的搜索性能主要依赖于分词(tokenization)和倒排索引(inverted index)这两个核心技术。原创 2024-08-06 15:17:55 · 348 阅读 · 0 评论