Elasticsearch学习笔记（二）：ES的核心概念

最新推荐文章于 2024-03-25 16:30:59 发布

笼中人.

最新推荐文章于 2024-03-25 16:30:59 发布

阅读量567

点赞数 1

分类专栏： Elasticsearch 文章标签： elasticsearch

本文链接：https://blog.csdn.net/Lee_Ho_/article/details/91384194

版权

Elasticsearch 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

一：Lucene和ES的关系

Lucene，是一个先进，功能强大的搜索库，直接基于Lucene开发，非常复杂，api复杂（需要写大量的Java代码）。需要深入理解其原理（各种索引结构）。

ES：基于Lucene，隐藏其复杂性，提供简单易用的Restful API接口。ES是一个分布式的搜索和分析，存储引擎，支持PB级别的数据。

二：ES的核心概念

（1）：Near Relatime: 近实时，两个意思：从写入数据到可以被搜索有一个小延迟（大概一秒）；基于es搜索和分析可以达到秒级。

（2）：Cluster: 集群，包含多个节点，每个节点属于哪一个集群是通过配置（集群名称，默认是elasticsearch）来决定的。对于小型应用来说，刚开始一个集群就一个节点很正常。

（3）： Node:节点。集群当中的一个节点，节点也有一个名称，默认是随机分配的，节点名称很重要（在执行运维管理操作的时候），默认节点会加入到一个名为“elasticsearch”的集群。如果直接启动一堆节点，默认会加入名为elasticsearch的集群。

（4）： Document&field: 文档：es当中的最小单元，一个document可以是一条商品数据，也可以是一条订单数据，通常用JSON数据结构表示，每个index下的type当中，都可以去存储多个document，一个document中可以有多个field，field就是一个数据字段。

product document

{
"product_id": "1",
"product_name": "高露洁牙膏",
"product_desc": "高效美白",
"category_id": "2",
"category_name": "日化用品"
}

（5）：index: 索引，包含一堆有相似结构的文档数据，比如可以有一个客户索引，商品分类索引，订单索引，索引有一个名称。一个index包含很多document，一个index就代表了一类类似的或者相同的document，比如说一个product index，商品索引，里面可能就存放了所有的商品数据，所有的商品的document。

（6）：type：类型：每个索引当中都可以有一个type或者多个type，type是index的一个逻辑数据分类。一个type下的document，都有相同的field，比如博客系统，有一个索引，可以定义用户type，博客type，评论type等等。

商品index，里面存放了所有的商品数据，商品document

但是商品分很多种类，每个种类的document的field可能不太一样，比如说电器商品，可能还包含一些诸如售后时间范围这样的特殊field；生鲜商品，还包含一些诸如生鲜保质期之类的特殊field

type，日化商品type，电器商品type，生鲜商品type

日化商品type：product_id，product_name，product_desc，category_id，category_name
电器商品type：product_id，product_name，product_desc，category_id，category_name，service_period
生鲜商品type：product_id，product_name，product_desc，category_id，category_name，eat_period

每一个type里面，都会包含一堆document

{
"product_id": "2",
"product_name": "长虹电视机",
"product_desc": "4k高清",
"category_id": "3",
"category_name": "电器",
"service_period": "1年"
}

{
"product_id": "3",
"product_name": "基围虾",
"product_desc": "纯天然，冰岛产",
"category_id": "4",
"category_name": "生鲜",
"eat_period": "7天"
}

（7）：shard: 单台机器无法存储大量的数据，es可以将一个索引当中的数据切分为多个shard，分布在多台机器上存储，有了shard就可以横向扩展，存储更多的数据，让搜索和分析等操作分布在多台机器上去执行，提升吞吐量和性能，每个shard都是一个Lucene index。

（8）：replica: 任何一个服务器随时都有可能宕机或者故障，此时shard就有可能丢失，因此可以为每个shard创建多个replica副本，replica可以在shard故障时提供备用服务，以保证数据不会丢失，多个replica可以提升搜索操作的吞吐量和性能。primary shard（建立索引时一次设置，不能修改，默认5个），replica shard（随时修改数量，每个shard默认一个）。默认每个索引10个shard，5个primary shard，5个replica shard，最小的高可用配置，是2台机器。

3、elasticsearch核心概念 vs. 数据库核心概念

Elasticsearch 数据库

-----------------------------------------

Document           行
Type               表
Index               库

笼中人.

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
Elasticsearch学习笔记（二）：ES的核心概念

一：Lucene和ES的关系 Lucene，是一个先进，功能强大的搜索库，直接基于Lucene开发，非常复杂，api复杂（需要写大量的Java代码）。需要深入理解其原理（各种索引结构）。 ES：基于Lucene，隐藏其复杂性，提供简单易用的Restful API接口。ES是一个分布式的搜索和分析，存储引擎，支持PB级别的数据。二：ES的核心概...
复制链接

扫一扫

专栏目录