Elasticsearch-1-核心概念和原理_核心跟原理是一个概念吗-CSDN博客

本文链接：https://blog.csdn.net/y649877086/article/details/108437547

搜索：通过一个关键词或一段描述，得到你想要的（相关度较高的）结果

（1）关系型数据库，例如MySQL

select * from product where brand like '%小米NFC智能手机%'

（1）倒排索引的数据结构

倒排索引–基于Document实现，根据关键词去创建索引

首先对数据库中数据表的列的数据进行分词，然后对搜索关键字进行分词，用分词后的数据去数据库表中进行匹配，匹配到次数较多的id表示搜索的数据的相关度较高，结果更准确。

如下图：简单概念

数据进行拆分后，数据会更大，用空间换时间。

（2） Lucene：jar包，基于Java开发，帮我们创建倒排索引，并且提供了复杂的API

（3）如果使用Lucene做集群实现搜索，会有哪些问题？

(1) 基于Lucene的分布式的Restful风格的搜索、存储和分析引擎

(2) 优点：

(3) 应用领域：

（1）Cluster（集群）：每个集群至少包含两个节点

（2）Node：集群中的每个节点，一个节点不代表一台服务器

（3）Field：一个数据字段，与index和type一起，可以定位一个doc

（4）Document：ES最小的数据单元，Json格式

{
    "id": 1,
    "name": "小米",
    "price": {
        "标准版": 3999,
        "尊享版": 4999,
        "签名定制版": 1999
    }
}

（5）Type：逻辑上的数据分类，ES7.x取消了Type的概念

（6）Index：一类相同或者类似的Document，比如一个员工索引，商品索引

（7）Shard分片

两种分片类型：
- primary shard：主分片
  在创建索引的时候，除非手动配置了primary shard的数量，否则es默认配置为5个primary，如果需要修改索引的primary的数量，需要重建索引
- replica shard：副本分片
  es默认为每个primary shard分配一个replica shard，replica shard数量可动态修改
特点：
- 每一个shard都是一个Lucene实例，具有完整的创建索引和处理搜索请求的能力。
- ES会自动在nodes上为我们做Shard均衡。
- 一个document是不能同时存在于多个Primary Shard中的，但是可以存在于多个RShard中。
- primary shard不能和他的replica shard存在于同一个节点，这不符合高可用的规范，因为一旦节点宕机，主副分片同时丢失，所以最小的可用配置是两个节点，互为主备。

在这里插入图片描述