最新使用es必须要知道的一些知识点:索引篇_es创建索引,那些被大厂优化的程序员们

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

    }
  }
]

}
}


这个动态模板规则将会把所有字符串字段映射为`keyword`类型。



> 
> 动态模板常见设置:https://blog.csdn.net/liuwenqiang1314/article/details/125861920
> 
> 
> 


#### 使用动态模板时,如何防止子属性溢出


使用动态模板时,class属性要i禁用Map结构。原因:es索引key数量默认不能超过1000。  
 es数据底层存储的时候是按照json结构的,Map结构的数据存储到es,key是不固定的,随着数据量的扩张,key的数量可能超过1000,此时es会抛出异常。



> 
> illegal\_argument\_exception, reason=Limit of total fields [1000] in index [fcs\_biz\_bill\_body\_dev] has been exceeded
> 
> 
> 


这个错误是由于Elasticsearch索引中的字段数超过了默认限制(1000个字段)所导致的。当我们尝试在一个索引中创建太多字段时,Elasticsearch会抛出这个异常。  
 解决此问题有两种方法:


1. 增加索引的`index.mapping.total_fields.limit`设置值。我们可以通过更新索引设置来增加允许的最大字段数。例如,将其更改为2000:



PUT /fcs_biz_bill_body_dev/_settings
{
“index”: {
“mapping”: {
“total_fields”: {
“limit”: 2000
}
}
}
}


请注意,在生产环境中谨慎使用这种方法,因为大量字段可能会影响性能和资源利用率。


检查并优化数据模型:如果不需要那么多字段,请考虑重新设计或优化数据模型以减少不必要的字段。这可能包括删除未使用或重复的属性、合并相关属性等。  
 2. 对不需要索引的object属性禁用动态模板  
 在Elasticsearch中,动态模板可以用来控制新字段的映射。要实现遇到Map结构时不创建属性,你可以使用以下设置:


* 通过正则匹配相应的属性
* 设置`mapping.enabled: false`


这是一个示例配置:



{
“mappings”: {
“_doc”: {
“dynamic_templates”: [
{
“not_analyzed_map”: {
“match_pattern”: “regex”,
“path_match”: “^map_.*$”,
“mapping”: {
“enabled”: false
}
}
}
]
}
}
}


#### 批量处理器(Bulk Processor)不建议处理多个索引模板的请求


一个批量处理器(Bulk Processor)不建议处理多个索引模板的请求,尤其是当这些索引模板的分区规则不一致时,主要是因为以下原因:


1. 分区规则不一致:不同的索引模板可能具有不同的分区规则,例如按时间分区、按地理位置分区等。当批量处理器处理多个索引模板的请求时,如果分区规则不一致,会导致数据在不同的分区之间不均匀分布,影响查询性能和数据的存储效率。
2. 索引设置不同:每个索引模板可能具有不同的索引设置,如副本数量、刷新间隔、分片数量等。当批量处理器处理多个索引模板时,这些不同的设置可能会导致性能差异或资源的不均衡分配。
3. 管理复杂性:处理多个索引模板的请求会增加管理的复杂性,包括索引模板的创建、更新和删除等操作。同时维护多个不同设置和规则的索引模板也会增加配置和维护的工作量。


为了确保良好的性能和简化管理,建议将具有相同分区规则和设置的索引请求分组处理。这样可以确保数据在相同的分区规则下均匀分布,并且能够更有效地管理索引的创建、更新和删除等操作。


### 三、性能调优


涉及性能的时候,批量的大小很关键。如果你的批量太大,它们会占用过多的内存。如果它们太小,网络开销又会很大。最佳的平衡点,取决于文档的大小——如果文档很大,每个批量中就少放几篇;如果文档很小,就多放几篇——以及集群的能力。


#### 多条搜索(Multi Search)和多条获取(Multi Get)


多条搜索(Multi Search)和多条获取(Multi Get)是两种在Elasticsearch中进行批量操作的功能,但它们的用途和操作对象存在一些区别:


1. 多条搜索(Multi Search):


	* 多条搜索是同时执行多个搜索请求的功能。可以在单个请求中发送多个搜索请求,并一次性获取它们的结果。
	* 多条搜索适用于在不同的索引、类型或查询条件上执行多个搜索操作。
	* 多条搜索请求的结果将按照请求的顺序返回,每个搜索请求的结果都是独立的。
2. 多条获取(Multi Get):


	* 多条获取是同时从多个索引中获取多个文档的功能。它允许在单个请求中指定多个文档的ID,并一次性获取它们的内容。
	* 多条获取适用于根据文档的ID获取多个文档的情况,可以跨越不同的索引和类型。
	* 多条获取请求的结果将按照请求的顺序返回,每个获取请求的结果都是对应的文档内容。


总结:  
 多条搜索适用于执行多个搜索请求,获取符合条件的文档结果;而多条获取适用于根据文档的ID获取多个文档的内容。


#### 刷新(Refresh)和冲刷(Flush)


在Elasticsearch中,刷新(Refresh)和冲刷(Flush)是两个不同的操作,它们具有以下区别:


1. 刷新(Refresh):


	* 刷新是指将索引中的最新更改从内存刷新到磁盘的持久化存储结构(translog)中,**以使这些更改对搜索可见**,并不会直接刷新到磁盘。
	* 当进行索引操作(如文档的创建、更新、删除)时,数据会首先写入内存中的事务日志(translog),而不是直接写入磁盘。刷新操作将事务日志中的数据写入磁盘,以确保最新的更改对搜索可见。
	* 刷新操作通常由Elasticsearch自动触发,但也可以通过执行手动刷新操作来强制将最新更改刷新到磁盘。
	* 刷新操作会导致短暂的性能开销,因为它需要将数据从内存写入磁盘。但它确保了数据的持久性和一致性。
2. 冲刷(Flush):


	* 冲刷是指将索引的所有未决更改写入磁盘,以确保数据的持久性。
	* 当进行索引操作时,数据首先写入内存中的事务日志和缓冲区。但它们不会立即写入磁盘,而是留存在内存中,直到触发冲刷操作。
	* 冲刷操作将内存中的事务日志和缓冲区的数据写入磁盘,确保了数据的持久性和一致性。
	* 冲刷操作通常由Elasticsearch自动触发,但也可以通过执行手动冲刷操作来强制将未决更改写入磁盘。
	* 冲刷操作可能会导致短暂的性能开销,因为它需要将数据从内存写入磁盘。


总结:  
 刷新操作将最新的更改从内存刷新到磁盘的持久化存储结构(translog)中,以使其对搜索可见;而冲刷操作将所有未决更改从内存写入磁盘,确保数据的持久性。刷新操作通常是自动触发的,而冲刷操作可以手动触发。


冲刷流程如下图:  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/2246bca0032f4b1bafc63038ea54b8d8.png)


#### 合并分段




![img](https://img-blog.csdnimg.cn/img_convert/511216b8d9b458f33d2050438c7b1184.png)
![img](https://img-blog.csdnimg.cn/img_convert/6eb4befba5959c81b9374246444c7adf.png)
![img](https://img-blog.csdnimg.cn/img_convert/cac9844d7d78a125ab4cb3b5a06be5f0.png)

**既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!**

**由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新**

**[需要这份系统化资料的朋友,可以戳这里获取](https://bbs.csdn.net/forums/4f45ff00ff254613a03fab5e56a57acb)**

阶课程,涵盖了95%以上大数据知识点,真正体系化!**

**由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新**

**[需要这份系统化资料的朋友,可以戳这里获取](https://bbs.csdn.net/forums/4f45ff00ff254613a03fab5e56a57acb)**

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值