elasticsearch2
文章平均质量分 83
ChasingdreamLY
一个不想写程序又想赚钱的码农......
展开
-
ElasticSearch 菜鸟笔记 (一)ElasticSearch 入门简介
前言ElasticSearch 是一个高可用开源全文检索和分析组件。提供存储服务,搜索服务,大数据准实时分析等。一般用于提供一些提供复杂搜索的应用。 ElasticSearch 提供了一套基于restful风格的全文检索服务组件。前身是compass,直到2010被一家公司接管进行维护,开始商业化,并提供了ElasticSearch 一些相关的产品,包括大家比较熟悉的 kibana、logstas转载 2018-03-13 17:48:14 · 29293 阅读 · 0 评论 -
Elasticsearch实现原理分析-1
介绍本文是分析Elasticsearch系列文章中的一篇,是一个译文。共有三篇,每篇讲解部分Elasticsearch的实现原理。 在翻译的过程中,也需要查看对应部分的源码,来加深对实现原理的理解。但这里并没有对源码进行分析,源码的分析放到后面的系列文章进行介绍。 本文介绍了Elasticsearch的以下原理: 是Master/Slave架构,还是Master-less架构?转载 2018-04-17 14:20:37 · 296 阅读 · 0 评论 -
TF-IDF及其算法
概念 TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻引擎应用,作为文件转载 2018-04-17 14:32:32 · 1740 阅读 · 1 评论 -
Elasticsearch实现原理分析-2
介绍第1部分分析了Elasticsearch基本的读、写、更新、存储等方面的实现原理,本文档主要介绍Elasticsearch如何实现分布式系统的三个特性(consensus, concurrency和consistency),以及分片的内部概念,例如:translog(Write Ahead Log - WAL)和Lucene segments。 本章主要包括以下内容: Consensus:转载 2018-04-17 14:50:35 · 256 阅读 · 0 评论 -
Elasticsearch实现原理分析-3
介绍在之前的一篇文章中,我们讨论了Elasticsearch如何处理分布式系统的一些基本问题。在这篇文章中,我们将会审查Elasticsearch的各个方面,例如接近实时的搜索和权衡,它考虑计算Insight Data Engineering Fellows在构建数据平台时利用的搜索相关性。 —–近实时搜索 —–为什么深度分页在分布式搜索可能是危险的? —–计算搜索相关性的权衡近实时...转载 2018-04-17 15:05:50 · 275 阅读 · 0 评论 -
elasticsearch以及其中倒排索引理解搜索引擎
倒排索引的介绍:倒排索引实际上由于应用中需要根据属性值来查找记录,这种索引表中的每一项都包含一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称之为倒排索引(inverted index),带有倒排索引的文件称之为倒排索引文件,简称倒排文件。比如说我们接下来要搜索下面的这句话: “python写各大聊天系统的屏蔽脏话功能原理” 于是根据搜索引擎原创 2018-04-17 15:14:12 · 1813 阅读 · 0 评论 -
Elasticsearch查询规则:match和term
es种有两种查询模式,一种是像传递URL参数一样去传递查询语句,被称为简单搜索或查询字符串(query string)搜索,比如GET /megacorp/employee/_search //查询全部员工GET /megacorp/employee/_search?q=last_name:Smith //查询last_name为Smith的员工另外一种是通过DSL语句来进行查询,被称为DSL查询转载 2018-04-17 16:19:41 · 1040 阅读 · 0 评论