【002】Elasticsearch 核心概念描述

 

    1.近实时

       它是一个近实时的数据搜索和分析平台。这意味着从索引文档到可搜索文档都会有一段微小的延迟(通常是1秒以内)。

    2.集群

  涉及大数据相关的系统都 少不了集群。大数据需要解决 以下几个问题

  (1)数据怎样存

 (2) 如何检索数据

  (3)如何展现数据(即,如何发挥数据的价值)

    这里的概念也不例外:

      集群是一个或多个节点的集合,这些节点将共同拥有完整的数据,并跨节点提供联合索引,搜索和分析的功能。集群由唯一的名称标识 (elasticsearch.yml里面配置的cluster.name),集群的名称是elasticsearch.yml配置文件中的最重要的一个参数,默认名称为Elasticsearch,节点只能通过集群名称来加入集群。

   请确保不要再不同的环境中使用相同的集群名称,否则可能导致节点加入错误的集群。

   搞过大数据,或者用过分布式相关系统中间件的对这些概念肯定是很熟悉。例如:RocketMQ ,kafka ,hadoop ,redis等。

3.节点

 节点是一个Elasticsearch的运行实例,也就是一个进程,多个节点组成集群,节点存储数据,并参与集群的索引,搜索和分析功能。与集群一样,节点由一个名称标识,默认情况下,该名称是在启动的时候分配给节点的唯一标识符(UUID)。

  在单个集群中,可以有任意多个节点。

 4.索引

 索引 是具有某种相似特性的文档集合。索引由一个名称(必须全部是小写)标识,当对其中的文档执行索引,搜索,更新和删除操作时,该名称指向这个特点的索引。单个集群中,可以定义任意多的索引。

5.类型

 废弃,不再详细了解

6.文档

 文档是可以被索引的基本信息单元。例如,可以为单个客户创建一个文档,为单个产品创建一个文档,以及为单个订单创建另一个文档。文档以JSON表示。在单个索引中,理论上可以存储任意多的文档。

7.分片和副本

索引可能会存储大量数据,这些数据可能会超出单个节点的硬件限制。

 为了解决这个问题,Elasticsearch提供了将索引水平切分为多段的能力。创建索引的时候,只需要定义所需要的分片数量。每个分片本身就是一个具有完整功能的独立索引,可以分布在集群中的任何节点上。

分片很重要,

1.分片可以水平拆分数据,实现大数据存储和分析

2.可以跨越发呢排,进行分发和并行操作,从而提高性能和吞吐量。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值