ElasticSearch
文章平均质量分 65
wust_tanyao
这个作者很懒,什么都没留下…
展开
-
图解Elasticsearch中的_source、_all、store和index属性
Elasticsearch中有几个关键属性容易混淆,很多人搞不清楚_source字段里存储的是什么?store属性的true或false和_source字段有什么关系?store属性设置为true和_all有什么关系?index属性又起到什么作用?什么时候设置store属性为true?什么时候应该开启_all字段?本文通过图解的方式,深入理解Elasticsearch中的_source、_all、...转载 2018-04-27 14:41:44 · 1196 阅读 · 0 评论 -
elasticsearch的autocomplete
对于搜索引擎来说,在键入搜索关键词的过程中进行自动提词是个重要的功能,es对此也提供了支持。这个功能是不是有点类似于prefixquery呢,看上去是的。但是,prefixquery是否会符合条件的doc,而自动提词是返回符合条件的term。所以二者不能混为一谈。因此suggestion模块出现了。我们聚焦下complete。1:为什么需要一个的单独的suggest?速度为先:为了提词,一个完整的...转载 2018-07-13 15:35:50 · 978 阅读 · 0 评论 -
lucene4.5源码分析系列:lucene的默认评分算法-向量空间模型(Vector Space Model)
在lucene4以前,一直都是使用经典的向量空间模型作为其检索模型,这种方式虽然统一了评分算法,简化了计算,但是带来的问题是很难去调整,一旦向量空间模型不适合,也很难去替换一种更好的算法。 而lucene4则将检索模型与事实上的搜索做了解耦和抽象,并且加入了另外几种检索模型的实现,其中就有经典的BM25。 经典的向量空间模型的理论基础及其在lucene中的应用 向量空间模型是信息检索领域中一...转载 2018-07-13 19:36:49 · 213 阅读 · 0 评论 -
Elasticsearch整理之mapping的参数
https://blog.csdn.net/Interstellar_/article/details/81359301#22.%20term_vector 目录一、Mapping的参数1. analyzer2. normalizer3. boost4. coerce5. copy_to6. doc_values7. dynamic8. enabl...转载 2018-09-12 17:49:03 · 584 阅读 · 0 评论 -
Elasticsearch 5.x 字段折叠(Field Collapsing)的使用
在 Elasticsearch 5.x 有一个字段折叠(Field Collapsing,#22337)的功能非常有意思,在这里分享一下, 字段折叠是一个很有历史的需求了,可以看这个 issue,编号#256,最初是2010年7月提的issue,也是讨论最多的帖子之一(240+评论),熬了6年才支持的特性,你说牛不牛,哈哈。 目测该特性将于5.3发布,尝鲜地址:Elasticsearch-...转载 2018-10-20 17:32:39 · 1081 阅读 · 2 评论 -
ElasticSearch搜索底层基础原理总结
http://blog.51cto.com/qinbin/2051098 目录: 1._search结果分析 2.multi-index和multi-type 3.分页查询与deep paging 4.query DSL和query string 5.mapping 6.倒排索引和正排索引(doc value) 7、分词...转载 2018-10-20 20:12:51 · 2046 阅读 · 0 评论 -
Elasticsearch Analyzer 的内部机制
本文将介绍各种 Analyzer,以及他们各种的应用场景。涉及到的概念 Character filter Tokenizer Token filter Analyzer Term query 1 前言Analyzer 一般由三部分构成,character filters、tokenizers、token filters。掌握了 Analyz...转载 2018-10-20 20:17:04 · 686 阅读 · 1 评论 -
关于Tokenizer与TokenFilter的区别
TokenStream是一个能在被调用后产生语汇单元流的类,但是 TokenStream 类有两个不同的类型:Tokenizer 类和 TokenFilter 类。这两个类都是从抽象类TokenStream类继承而来。 Tokenizer 对象通过Java.io.Reader 对象读取字符创建语汇单元,而TokenFilter 类则负责处理输入的语汇单元,然后通过新增、删除或者修改...转载 2019-01-22 16:43:38 · 599 阅读 · 0 评论