背景
随着业务量的增加,以及其他厂商数据的对接整个,我们的数据量从每天gb到pb的增加,实现了千亿级别的经济方案。
疼点:Elasticsearch在新建索引都需要指定shard分片数,当索引数据量增加不好扩容,业务代码需要调整等等;
索引别名
Elasticsearch中的API在针对特定索引时接受索引名称,并在适用时接受多个索引。索引别名API允许使用名称别名化索引,所有API都自动将别名转换为实际索引名称。别名也可以映射到多个索引,并且在指定别名时,别名将自动扩展为别名索引。别名还可以与在搜索和路由值时自动应用的过滤器相关联。别名不能与索引同名。
官方文档定义:
https://www.elastic.co/guide/en/elasticsearch/reference/current/indices-aliases.html
帮助我们解决什么样的问题?
1.数据增量横向扩展(我们每天的数据增量几十亿,以前老的架构每天需要建一个分区表,前期在别名使用不好的时候,评估3个月的数据存储量,建好索引,不太方便)。
2.每一个索引(三个月每天的索引的别名都使用同一个,查询方案,删除数据方案,主要是3个月以前的时间我们需要删除操作,使用java api的方式简直是没法做的)。
3.在一个集群中的数据非常好的对接到新的索引上面(我们在做数据迁移的时候,比如我们迁移率16年的数据到一个索引,17年的数据在一个索引,后面要做合并操作,有了别名就太方案)。
索引通过上面的方式很好的解决了我们数据扩容的问题,数据清除的问题。
demo实践
1.创建索引
下面的代码我分别创建了 log2017,log2018,log2019三个索引,按照我们业务的划分,17,18,19年的数据会单独存放到对应的所有库中;
private static Logger log = Logger.getLogger(LogIndex.class);
//分别建log2017,log2018,log2019索引名
//索引名称
private static String indexNam

随着数据量从GB到PB的急剧增长,Elasticsearch的索引管理成为挑战。文章介绍了如何利用索引别名解决扩容、数据清理等问题。通过创建和管理别名,实现数据的横向扩展,简化查询和删除操作,并在数据迁移时提供便利。作者分享了具体的demo实践,包括创建索引、导入数据、设置别名以及通过别名进行多索引查询。
最低0.47元/天 解锁文章
3361

被折叠的 条评论
为什么被折叠?



