一、数仓模型优化-如何判断一个数据模型的好坏
1.完善度
汇总数据能直接满足多少查询需求,即应用层访问汇总层数据的查询比例
跨层引用率:ODS层直接被DWS/ADS/DM层引用的表,占所有ODS层表比例
可以快速响应业务方的需求
比较好的模型,使用方式是可以直接从该模型获取所有想要的数据的,如果DWS,ADS,DM层直接引用ODS层的表比例太大,即跨层引用率太高,则该模型不是最优,可以继续优化
2.复用度
模型引用系数:模型被读取并产出下游模型的平均数量
3.规范度
主题域归属
分层信息
脚本及任务命名规范
表命名符合规范(清晰、一致,见名知意)
字段命名是依赖于词根
4.稳定性
能否保证日常的sla(时效保障)
5.扩展性