Elasticsearch数据建模最佳实践

建模建议一:处理关联关系
  • Object:优先考虑Denormalization
  • Nested:当数据包含多数值对象(1:n),同时有查询需求
  • Parent/Child:关联文档更新非常频繁

PS:Kibana暂时不支持Nested类型和Parent/Child类型,如果需要使用Kibana进行数据分析则需要作出取舍

建模建议二:避免过多字段
  • 字段过多不易维护,mappings信息保存在Cluster state中,数据量过大对集群性能可能会有影响(Cluster
    State需要在所有节点间同步)
  • 默认最大字段数是1000,可以设置index.mapping.total_fields.limt限定最大字段数
  • 使用 Nested 对象解决动态加入新字段导致mappings不断膨胀

PS:通过Nested对象保存key/value的一些不足:可以减少字段数量,解决cluster state中保存过多meta信息的问题,但是会导致查询语句复杂度增加,Nested对象不利于在Kibana中实现可视化分析

建模建议三:避免正则查询
  • 正则、通配符查询、前缀查询属于Term查询,但是性能不够好,特别是将通配符放在开头

PS:解决方法:将字符串转换为对象

建模建议四:避免空值引起的聚合不准

PS:解决方法:将空值设置个默认值(null_value)

建模建议五:为索引的mappings加入meta信息
  • mappings设置非常重要,需要从两个维度进行考虑:功能(搜索、排序、聚合);性能(存储的开销,内存的开销,搜索的性能)
  • Mappings设置是一个迭代的过程:加入新的字段很容易(必要时需要update_by_query);更新删除字段不允许(需要reindex重建数据);最好能对mappings加入meta信息,更好的进行版本管理

PS:建议将mappings文件上传git进行管理

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值