Elasticsearch6.5中文文档-基本概念

Elasticsearch有一些核心概念,在学习前,先理解这些概念,可以极大的帮助您简化学习过程。


近实时(NRT)
Elasticsearch是近实时搜索平台。这意味着从索引文档到可搜索到这段时间之间存在少许延迟(通常为一秒钟)。

 

集群
群集是一个或多个节点(服务器)的集合,这些节点一起保存您的全部数据,并在所有节点之间提供联合索引和搜索功能。集群由唯一名称标识,默认情况下为“ elasticsearch”。此名称很重要,因为如果节点被设置为通过其名称加入群集,则只能通过名称进行配置。

确保不要在不同的环境中重复使用相同的集群名称,否则最终可能会导致节点加入错误的集群。例如,您可以将logging-dev,logging-stage和logging-prod 用于开发,测试和生产集群。

请注意,只有一个节点的集群是有效且可行的。此外,您也可以建立多个独立的群集,每个群集都有其唯一的群集名称。


节点
节点是单个服务器,它是群集的一部分,存储数据并参与群集的索引和搜索功能。就像群集一样,节点由名称标识,该名称默认为在启动时随机分配给该节点的唯一通用标识符(UUID)。如果您不想使用默认的节点名称,则可以自定义节点名称。该名称对于管理很重要,比如在管理中您要识别网络中的哪些服务器与Elasticsearch群集中的哪些节点相对应时。

可以将节点配置为通过集群名称加入特定集群。默认情况下,每个节点都设置为加入一个名为elasticsearch的集群,这意味着如果您在网络上启动了多个节点,并且假设它们可以相互发现,它们将全部自动形成一个名为elasticsearch的集群。

在单个群集中,可以根据需要拥有任意数量的节点。此外,如果您的网络上当前没有其他Elasticsearch节点在运行,则默认情况下开启单节点集群,名为elasticsearch。


索引
索引是具有相似特征的文档的集合。例如,您可以为客户数据创建索引,为产品目录创建另一个索引,为订单数据创建另一个索引。索引由名称标识(必须全为小写),并且对文档执行索引,搜索,更新和删除操作时,会通过名字找到对应索引。

在单个群集中,您可以定义任意多个索引。


类型
(在6.0.0中已弃用。
请参阅删除映射类型)

类型曾经是索引的逻辑类别/分区,它使您可以在同一索引中存储不同类型的文档,例如,一种用于用户,另一种用于博客文章。以后不再可以在索引中创建多个类型,并且以后的版本中将删除整个类型的概念。有关更多信息,请参见删除映射类型。

文件
文件是可以建立索引的基本信息单位。例如,您可以有一个针对单个客户的文件,一个针对单个产品的文件,以及另一个针对单个订单的文件。本文件以JSON(JavaScript对象表示法)表示,JSON是一种普遍存在的Internet数据交换格式。

在索引/类型中,您可以存储任意数量的文件。请注意,尽管文件实际上位于索引中,也必须将文件编入索引/分配给索引内的类型。

分片和副本
索引可能会存储大量数据,这些数据可能超过单个节点的硬件限制。例如,十亿个文档的单个索引要占用1TB的磁盘空间,可能单个节点的磁盘存不下,或者可能太慢而无法满足搜索请求。

为了解决此问题,Elasticsearch提供了将索引细分为多个碎片的功能,也就是分片。创建索引时,只需定义所需的分片数量即可。每个分片本身就是一个功能齐全且独立的“索引”,可以托管在群集中的任何节点上。

分片很重要,主要有两个原因:

  • 它允许您水平分割/缩放内容量
  • 它允许您跨分片(可能在多个节点上)分布和并行化操作,从而提高性能/吞吐量

分片如何分布以及其文档如何聚合回到搜索请求中的机制完全由Elasticsearch管理,并且对用户是透明的。

在随时可能发生故障的网络/云环境中,强烈建议您使用故障转移机制,以防分片/节点因某种原因脱机或消失。为此,Elasticsearch允许您将索引分片的一个或多个副本制作为所谓的副本分片(简称副本)。

副本很重要,主要有两个原因:

  • 如果分片/节点发生故障,它可提供高可用性。因此,重要的是要注意,副本分片永远不会与原分片/主分片的节点分配在同一节点上。
  • 由于可以在所有副本上并行执行搜索,因此它可以扩展搜索量/吞吐量。

总而言之,每个索引可以分为多个分片。索引也可以被复制零(意味着没有副本)或更多次。复制后,每个索引将具有主分片(从中复制的原始分片)和副本分片(主分片的副本)。

可以在创建索引时为每个索引定义分片和副本的数量。创建索引后,您还可以随时动态更改副本数。您可以使用_shrink和_splitAPI更改现有索引的分片数量,但这并不是一件容易的事,因此预先计划正确的分片数量是最佳方法。

默认情况下,Elasticsearch中的每个索引分配有5个主分片和1个副本,这意味着如果集群中至少有两个节点,索引将具有5个主分片和另外5个副本分片(1个完整副本),总计每个索引10个分片。

(每个Elasticsearch分片都是一个Lucene索引。一个Lucene索引中可以包含的文档数量上限。截至LUCENE-5843,限制为2,147,483,519(= Integer.MAX_VALUE-128)个文档。您可以使用_cat/shardsAPI监控分片大小。)

接下来,让我们开始有趣的部分...
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值