可以储存照片的字段类型是_elastic 数据建模，怎么规划数据的字段类型、分片数量、是否索引...

最新推荐文章于 2023-02-27 16:57:06 发布

weixin_39843986

最新推荐文章于 2023-02-27 16:57:06 发布

阅读量145

点赞数

文章标签：可以储存照片的字段类型是

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39843986/article/details/112469336

版权

本文探讨了Elasticsearch的数据建模，强调了与关系型数据库的不同，如处理关联关系、嵌套对象和父-子关系。在设计数据模型时，考虑了扩容、功能需求和性能需求。字段类型如text与keyword的选择，以及如何根据业务需求调整字段的index、norms、doc_values等属性以优化检索、聚合和排序。还提供了案例分析，解决网络传输效率问题。

摘要由CSDN通过智能技术生成

什么是数据建模？

为了充分利用 Elasticsearch，你需要了解它的工作机制，以及如何让它如你所需的进行工作。

和专用的关系型数据存储有所不同，Elasticsearch 并没有对处理实体之间的关系给出直接的方法。一个关系数据库的黄金法则是 --规范化你的数据(范式)-- 但这不适用于 Elasticsearch。在关联关系处理、嵌套对象和父-子关系文档我们讨论了这些提供的方法的优点和缺点。

然后在扩容设计我们谈论 Elasticsearch 提供的快速、灵活的扩容能力。当然扩容并没有一个放之四海而皆准的方案。你需要考虑这些通过系统产生的数据流的具体特点，据此设计你的模型。例如日志事件或者社交网络流这些时间序列数据类型，和静态文档集合在处理模型上有着很大的不同。

创建数据模型的过程：概念模型=》逻辑模型=》数据模型

数据模型：结合具体的数据库，在满足业务读写性能要求下，确定最终定义

数据建模主要从两个维度来考量：功能需求+性能需求

如何对字段进行建模

字段类型：text vs keyword

text :会被全文本分词，默认不支持聚合分析及排序(需要设置filedata=true)

keyword: 用于id枚举不需要分词的文本。

例如电话号码，email

适用于filter精确匹配 sorting 和 aggs

设置多字段类型：

默认会为文本类型设置text，并且设置一个keyword子字段

结构化数据：

数值类型：尽量选贴近类型，例如可以用byte就不要用long

枚举类型：设置为keyword，即便是数字也设置成keyword获取更好的性能

检索

如果不需要检索，就把index设置false

对需要检索字段可以通过如下配置，设定存储颗粒度：index_option / norms 不需要归一化数据，可以关闭达到节省存储空间。

聚合和排序

如不需要排序检索聚合分析，把enable设置false

如不需要排序或者聚合分析，把doc_values / filedata 设置false

更新频繁，聚合查询频繁keyword字段类型，建议把eager_global_ordinals设置true，帮助你很好的利用缓存。

额外的存储

是否需要专门存储当前字段数据：store 设置true 可以存储该字段的原始内容，一般结合_source的enable为false时候使用。

关闭_source 节约磁盘，适用于指标形数据：一般建议考虑增加压缩比，关闭_source导致无法reindex 和 update。

案例解析：

解决网络传输过大问题：

虽然找到了结果，但是_source字段看不到了。

通过指定stored_fields字段，来获取文档数据

weixin_39843986

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。