elasticsearch 增删改查操作

目录

 

1.写数据流程

2.删除数据流程

3.update数据流程

4.读数据流程    

 

 

 


1.写数据流程

写数据路由规则:
        1.每个index(类似于数据库中的表)由多个shard组成,每个shard有一个主节点(primary node)和多个副本节点(replica node)
        2.每次写入的时候,写入请求会现根据routing(路由)规则选择发给哪个shard(即在找primary node)
            路由规则:(1)index request 中可以设置使用哪一个field的值作为路由参数
                      (2)如果index没有设置,则使用mapping中的配置
                      (3)如果mapping中也没有设置,则使用id作为路由参数,然后通过id的hash值选出primary shard
        3.请求会发数据到primary shard,在primary shard上执行成功后再从primary shard上将请求同时发给多个replica shard上将请求同时发给多个replic
写数据流程:

 

2.删除数据流程:
       删除请求提交的时候会生成一个.del文件,里面将某个doc标识为delete状态,那么搜索的时候根据.del文件就知道doc被删除了,客户端搜索的时候发现数据在.del文件中标识为删除就不会搜索了

 

3.update数据流程:

        1.更新数据的时候会把更新请求分为inset和delete请求
        2.收到update后,从segment或者translog中读取同id的完整doc,记录版本号(例如:记录为v1=345)
        3.将版本v1的全量doc和请求中的部分字段doc合并为一个完整的doc,同时更新内存中的versionMap
        4.获取完整的doc后,update请求就变成了Post/Put请求
        5.加锁(乐观锁)
        6.再次从versionMap中读取该id的最大版本号V2=346
        7.检查版本是否冲突(v1==v2)如果冲突,则回退到开始的“update doc”阶段,重新执行,如果不冲突,则执行最新的Add请求
        8.在index doc阶段,首先将version +1 得到V3,再将doc加入到lucene中去,lucene中会删除同id下已存在的doc id,然后再增加新doc,写入lucene成功后,将当前V3更新到versionMap中
        9.释放锁,部分更新的流程结束

4.读数据流程:
        1.搜索被执行成两个阶段过程(query+Fetch)
        2.在初始查询时,查询会广播到索引中每个分片,拷贝(主分片或副本分片)每个分片在本地执行,搜索并构建一个匹配文档的大小为from+size的优先队列
            注意:在搜索的时候是会查询filesystem catche的,但是有部分数据还是在Memory buffer,所以搜素是近实时的
        3.每个分片返回各自优先队列中,所有文档的ID和排序值给协调节点,它合并这些值到自己的优先队列中,来生产一个全局排序后的结果列表
        4.接下来就是取回阶段,协调节点辨别出哪些文档需要被取回并向相关的分片提交多个GET请求,每个分片加载并丰富文档,如果需要的话,接着返回文档给协调节点。一旦所有文档都被取回了协调节点返回结果给客户端。

 

 


 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Elasticsearch是一个基于Lucene的全文搜索引擎,支持各种复杂查询,并提供实时索引、搜索功能。以下是关于在Elasticsearch中执行基本操作增删改查”的简要介绍: ### **增加数据(Insert)** 在 Elasticsearch 中添加文档通常涉及创建一个新的索引文件,将数据作为 JSON 格式的文档插入到相应的索引中。 ```bash POST /my_index/_doc { "name": "John Doe", "age": 30, "occupation": "Engineer" } ``` 这将在名为 `my_index` 的索引下创建一个新的文档。 ### **删除数据(Delete)** 从 Elasticsearch 删除数据相对简单,需要指定文档的ID以及它所在的索引名称。 ```bash DELETE /my_index/_doc/1 ``` 这里的 `/1` 表示要删除索引 `my_index` 下 ID 为 `1` 的文档。 ### **修改数据(Update)** 更新文档可以覆盖整个文档,也可以仅更新部分字段。为了更新现有文档并保持其原始状态,可以使用 `_source` 参数。 ```bash PUT /my_index/_update/1?pretty { "doc" : { "age": 45 } } ``` 或者更详细地更新特定字段: ```bash PUT /my_index/_update/1?pretty { "script" : "_source.age = doc.age + 15" } ``` 这里使用了脚本语言来计算新年龄值。 ### **查询数据(Query)** 查询功能允许通过复杂的条件搜索文档,可以使用 DSL(Domain Specific Language)来进行。例如,查找所有年龄大于30的工程师: ```bash GET /my_index/_search { "query": { "bool": { "must": [ { "match": { "occupation": "Engineer" } }, { "range": { "age": { "gt": 30 } } } ] } } } ``` 这个查询返回了满足条件的所有文档。 ### 相关问题: 1. **如何优化 Elasticsearch 查询性能**? 2. **Elasticsearch 如何处理大数据量的实时搜索需求**? 3. **如何监控 Elasticsearch 集群的状态及性能指标**? 这四个问题涵盖了从基础操作到高级管理和优化的主题,深入探讨了如何更好地利用 Elasticsearch 解决实际的搜索和分析场景。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值