1.完善度
-
汇总数据能直接满足多少查询需求,即应用层访问汇总层数据的查询比例
-
跨层引用率:ODS层直接被DWS/ADS/DM层引用的表,占所有ODS层表比例
-
可以快速响应业务方的需求
比较好的模型,使用方式是可以直接从该模型获取所有想要的数据的,如果DWS,ADS,DM层直接引用ODS层的表比例太大,即跨层引用率太高,则该模型不是最优,可以继续优化
2.复用度
模型引用系数:模型被读取并产出下游模型的平均数量
3.规范度
- 主题域归属
- 分层信息
- 脚本及任务命名规范
- 表命名符合规范(清晰、一致,见名知意)
- 字段命名是依赖于词根
4.稳定性
能否保证日常的sla(时效保障)
5.扩展性
新增加的模型是否和老的模型出现冲突
6.准确性&一致性
输出的指标数据质量能够保证
7.健壮性
业务快速更新迭代的情况下不会太影响底层模型
8.底成本
- 计算时间成本
- 计算资源成本
- 存储成本
总结
- 完善度,复用度,规范度基本上是需要了解业务,然后根据元数据信息去做统计分析的
- 稳定性,低成本是需要对任务进行优化,比如sql调优等
- 准确性和一致性是需要一套质量管理系统及指标一致性管理方案的,包括数据源,口径和指标管理平台等