ES核心
- 索引(库,用来存放多个文档,就是多个数据)
- 字段类型(就是数据类型的一个映射,最好是自己提前定义好数据类型,不然ES忙才数据类型有可能会翻车)
- 文档(就是一条条的记录)
- 分片(每个分片其实就是一个Lucene索引,Lucene是倒排索引!)
ES是面向文档的,一切都是JSON。和传统的关系型数据库的对比如下:
Relational DB | Elasticsearch |
---|---|
数据库(database) | 索引(indices) |
表(tables) | types |
行(rows) | documents |
字段(columns) | fields |
上面的表格就是关系型数据库和ElasticSearch中的概念的一个关系对应表个。可以帮助记忆和理解ES中的一些概念。
索引对应了数据库,索引里面的数据存放在文档中,文档种的字段有一些属性就叫做fields。对elastic search的初步理解。types慢慢会被弃用。
集群、节点、索引、类型、文档、分片、映射到底是什么?
物理设计
elastic search在后台把索引划分成多个分片,每个分片可以在集群中的不同服务中迁移。
逻辑设计
一个索引可以包含多个文档,当我们索引一个文档时可以按照这样的顺序去查找它:索引-->类型-->文档ID,文档ID不必须是一个数字,实际上它是一个字符串。
文档 document
(说白了就是一条条数据)前面的表格中,文旦对应了数据库中的行,行在关系型数据库中其实就是一个记录,也就是一条数据。
为什么说ES是面向文档的,因为索引和搜索数据的最小单位是文档,在ES中,文档有几个重要属性:
- 自我包含,一篇文档同时包含字段和对应的值,也就是同时包含key:value!
- 可以是层次性的,一个文档中包含自文档,复杂的逻辑实体就是这么来的{就是一个json对象!}
- 灵活的结构,文档不依赖预选定义的模型,关系型数据库中,要提前定义字段才能使用,在ES中,对于字段是非常灵活的,有时候我们可以忽略字段,或者动态的添加一个新的字段。
类型
类型就是文档的逻辑容器,就像关系型数据库一样,表格是行的容器。类型中对于字段的定义称为映射,比如name映射为字符串类型。我们说文档是无模式的,它们不需要拥有映射中所定义的所有字段,比如新增一个字段,那么es是怎么做的呢?elastic search自动的将新字段加入映射,但是这个字段不确定它的类型,elasticsearch就开始猜测,如果这个值是18,那么elastic search就会认为它是整型。但是也可能猜不对,因为最安全的方式是提前定义好所需要的映射,这个跟关系型数据库还是有点雷系了,先定义好字段,然后再使用它。
索引
就是数据库!
索引是映射类型的容器,elastic search中的索引是一个非常大的文档集合。索引中存储了映射类型的字段和其他设置,然后它们被存储到各个分片上了,下面来看下分片的工作方式。
![431c07c5e433d80b12c925ecc1351960.png](https://img-blog.csdnimg.cn/img_convert/431c07c5e433d80b12c925ecc1351960.png)
上图是一个包含三个节点的集群,如果其中一个节点不能使用了,数据也不至于丢失。
实际上,一个分片是一个Lucene索引,一个包含倒排索引的文件目录。倒排索引的结构使得elastic search再不扫描全部文档的情况下,就能告诉你哪些文档中包含特定的关键字。
倒排索引(重要!)
elasticsearch使用的是倒排索引的结构,采用Lucene倒排索引作为底层,这种结构适用于快速的全文搜索。一句话说倒排索引就是:将每篇文档划分为关键词,然后索引关键词包含在了哪些文档里面。(之前的索引方式是:列出每篇文档,然后在文档里面去索引包含了哪些关键词)。下面有个简单的例子来直观的说明什么是倒排索引。(下面其实就是多个分片,每个分片就是一个倒排索引而已!)
term | doc1 | doc2 |
---|---|---|
student | √ | √ |
study | × | √ |
every | √ | × |
date | × | √ |
现在来搜索student study,只需要查看包含这些词条的文档
term | doc1 | doc2 |
---|---|---|
student | √ | √ |
study | × | √ |
total | 1 | 2 |
分数的统计是自动化完成的,不需要我们认为的计算。采用倒排索引会大大的提高检索的速度。
我们只需要根据我们搜索的关键词去对应的文档里面搜索,完全过滤掉无关的东西。
总结:elastic search中,索引(就是库)被分为多个分片,每个分片其实就是一个Lucene的索引。所以一个elasticsearch索引就是由多个Lucene索引组成的。
接下来的一切操作都是在Kibana中的Dev Tools下的Console里面进行的。
done!