数据研发过程中的模型分类

本文探讨了数据研发中常见的五种模型:数仓模型、指标模型、标签模型、算法模型和主数据模型。主数据模型关注中心化数据管理,强调「取之于斯用之于斯」,尤其在政务领域,需支持多源化和一数多源。元数据管理和数据管理在这一过程中起着关键作用。
摘要由CSDN通过智能技术生成

数据研发过程中天天把模型挂嘴边,这次我们从使用和管理的角度分类来看一下。

模型分类:
1. 数仓模型: 一般指治理后的数据,属于维度建数仓的模思想中的 DWD/DWS 层
2. 指标模型: 统计类数据,属于维度建数仓的模思想中的 ADM 层
3. 标签模型: 归属于某个实体的统计类数据,属于维度建数仓的模思想中的 ADM 层
4. 算法模型: 算法的输入是数仓/指标/标签模型,输出是业务结果,属于业务模型
5. 主数据模型

主数据模型: 中心化数据管理,主要解决「取之于斯用之于斯」的问题
1. 元数据管理和数据管理方面需要增加「数源」标记
2. 政务领域的中心化,除了标准化外,还要支持多源化
3. 数据应用时,支持一数多源:比如地址信息,允许一个字段存储多分,来源不同
4. 政务领域的主数据模型,应该在 ADM 层

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值