什么是ES中间件?
简介:Elasticsearch,是ELK技术栈的一项,它是一款非常强大的开源分布式搜索引擎。结合Kibana,Logstash和Beats被广泛应用在日志数据分析,实时监控等领域。
Elasticsearch的底层基于Lucene,Luene是java语言的搜索引擎类库,Luene太过于底层使用起来非常的繁琐,Elasticsearch就是对Lucene的封装。
Elasticsearch搜索的核心概念:
Elasticseaerch是通过倒排索引实现的快速查找。
正向索引和倒排索引:
正向索引:
先通过文件名找到具体的文件,然后在获取文件内容,这既是正向所索引。msq的查询功能就是正向索引,先根据id查询记录,再从记录中获取相关的字段信息。
倒排索引:
根据文件内容查找,查找到包含这些文件内容的文件列表,再得到对应的信息。
过程:
1.将文档的内容通过算法进行分词,得到一个词条列表。
2.将词条列表当作key,包含该词条的文件id列表作为值,形成一张表。但是这张表跟数据库里的表不同。是两个完全不同的概念。
3.词条是唯一的,所以可以给词条创建索引,提高搜索效率。
4.然后通过词条查询到文档id,再通过文档id得到具体的文档。
Elasticsearch的相关概念对比MySQL
index(索引):
就相当于MySQL的数据中的表,但是,这个索引库里只有这一张表!换句话说就是索引库就是一张表,不能想像MySql那样可以表与表之间进行连接查询。并且索引库再查询时,实际上查询的就是数据中的信息。所以说在Elasticsearch中,索引值得
Document(文档):
文档就是一条条数据,就相当于数据库中的行。并且文档都是JSON格式。
Field(字段):
就是JSON中的字段,类似于数据库中的列。
Mapping(映射):
就是索引中文档的约束,例如字段类型约束。类似数据库的表的结构。
DSL:
是elasticsearch提供的JSON风格的请求语句,就是elasticsearch的语法,对标MySQL的SQL语法。