Elasticsearch入门——术语及概念

Elasticsearch术语及概念

1.索引词(term)

索引词是一个能够被索引的精确值。

2.文本

文本是一段普通的非结构化文字。通常,文本会被分析成一个个的索引词,存储在Elasticsearch的索引库中。

3.分析

分析是将文本转化索引词的过程,分析的结果依赖于分词器。

4.集群

集群是由多个节点组成,对外提供服务,对外提供索引和搜索功能。一个集群有多个节点,但一个节点只能加入一个集群。

5.节点

一个节点是一个逻辑上独立的的服务,它是集群的一部分,可以存储数据,并参与集群的索引和搜索功能。默认情况下,每个节点会加入名为Elasticsearch的集群中,这就意味着如果你在网络上启动多个节点,如果网络畅通,每个节点会自动加入一个名为Elastisearch的集群中。

6.路由

当存储一个文档的时候,它会存储在唯一的主分片中,具体哪个分片是通过散列值进行选择。默认情况下,这个值由文档的ID生成。如果文档有一个指定的父文档,则从父文档的ID生成,该值可以在存储文档时进行修改。

7.分片

分片是单个Lucene实例,这是Elasticsearch管理比较底层的功能。索引是指向主分片和副分片的逻辑空间。

8.主分片

每个文档都存储在一个分片中,当你存储一个文档的时候,系统会首先存储在主分片中,然后复制到不同的副本中。默认情况下,一个索引有5个主分片。你可以事先制定分片的数量,分片一旦建立,则分片的数量不能修改。

9.副本分片

每个分片有零个或多个副本。副本主要是主分片的复制,其中有两个目的:

  • 增加高可用性:当主分片失败的时候,可以从副本分片中选择一个作为主分片。
  • 提高性能:当查询的时候可以到主分片或者副本分片上进行查询。默认情况下,一个主分片配有一个副本,但是副本的数量可以在后面动态地配置增加。副本分片必须部署在不同的节点上,不能部署在和主节点相同的节点上。

分片主要有两个重要原因:

  • 允许水平分割扩展数据。
  • 允许分配和并行操作(可能在多个节点上)从而提高性能和吞吐量。

10.复制

复制很重要,主要原因有:

  • 它提供了高可用性,当节点失败时不受影响。一个复制的分片不会存储在同一个节点上。
  • 它允许你扩展搜索量,提高并发量,因为搜索可以在所有副本上并发执行。

11.索引

索引是具有相同结构的文档集合。

12.类型

在索引中可以定义一个或多个类型,类型是索引的逻辑分区。一般情况下,一种类型被定义为具有一组公共字段的文档。

13.文档

文档是存储在Elasticsearch中的一个JSON格式字符串。

14.映射

映射像关系数据库中的表结构,每个索引都有一个映射,它定义了索引中的每一个字段类型,以及一个索引范围内的设置。

15.字段

文档中包含零个或多个字段,字段可以是一个简单的值,也可以是一个数组或对象的嵌套结构。

16.来源字段

默认情况下,你的原文档将被存储在_source这个字段中,当你查询时,也是返回这个字段。

17.主键(ID)

ID是一个文件的唯一标识,如果在库存的时候没有提供ID,系统会自动生成一个ID,文档的index/type/id必须是唯一的。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值