数据模型优化(如何判断一个数据模型的好坏)

1.完善度

  • 汇总数据能直接满足多少查询需求,即应用层访问汇总层数据的查询比例

  • 跨层引用率:ODS层直接被DWS/ADS/DM层引用的表,占所有ODS层表比例

  • 可以快速响应业务方的需求

    比较好的模型,使用方式是可以直接从该模型获取所有想要的数据的,如果DWS,ADS,DM层直接引用ODS层的表比例太大,即跨层引用率太高,则该模型不是最优,可以继续优化

2.复用度

模型引用系数:模型被读取并产出下游模型的平均数量

3.规范度

  • 主题域归属
  • 分层信息
  • 脚本及任务命名规范
  • 表命名符合规范(清晰、一致,见名知意)
  • 字段命名是依赖于词根

4.稳定性

能否保证日常的sla(时效保障)

5.扩展性

新增加的模型是否和老的模型出现冲突

6.准确性&一致性

输出的指标数据质量能够保证

7.健壮性

业务快速更新迭代的情况下不会太影响底层模型

8.底成本

  • 计算时间成本
  • 计算资源成本
  • 存储成本

总结

  • 完善度,复用度,规范度基本上是需要了解业务,然后根据元数据信息去做统计分析的
  • 稳定性,低成本是需要对任务进行优化,比如sql调优等
  • 准确性和一致性是需要一套质量管理系统及指标一致性管理方案的,包括数据源,口径和指标管理平台等
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Dear丶TanTaiJin

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值