数据研发过程中天天把模型挂嘴边,这次我们从使用和管理的角度分类来看一下。
模型分类:
1. 数仓模型: 一般指治理后的数据,属于维度建数仓的模思想中的 DWD/DWS 层
2. 指标模型: 统计类数据,属于维度建数仓的模思想中的 ADM 层
3. 标签模型: 归属于某个实体的统计类数据,属于维度建数仓的模思想中的 ADM 层
4. 算法模型: 算法的输入是数仓/指标/标签模型,输出是业务结果,属于业务模型
5. 主数据模型
主数据模型: 中心化数据管理,主要解决「取之于斯用之于斯」的问题
1. 元数据管理和数据管理方面需要增加「数源」标记
2. 政务领域的中心化,除了标准化外,还要支持多源化
3. 数据应用时,支持一数多源:比如地址信息,允许一个字段存储多分,来源不同
4. 政务领域的主数据模型,应该在 ADM 层