一文搞懂企业级数据仓库实战

本文结合项目经验,详细总结了企业级数据仓库的实战要点,包括数仓痛点如数据孤岛、重复计算、指标口径不一致,以及解决策略如数据模型设计、数仓规范制定和外围系统建设。探讨了Inmon和Kimball两种建模方法,并对事实表、维度表、实体表的关系进行了解析。此外,还涵盖了离线处理、实时数仓、调度系统、数据质量监控等方面的发展方向。
摘要由CSDN通过智能技术生成

数据仓库总结

  • 项目上线了,结合数据仓库实战视频,复盘总结下。

历史的浪潮

发展阶段,自我认知

要点

1、数仓痛点

数仓痛点

  • 感受到疼痛的点
  1. 烟囱式开发形成的数据孤岛和重复计算:–建模规范和开发规范
  • 各业务系统都存在汇率、证券信息等公开市场信息的重复计算,重复做;
  • 客户信息表是全量,更新很少,但需要某个历史时刻的客户状态,重复做;
  1. 指标口径不一致导致数据可信度下降 : --指标字典
  • 同样的股基交易量,要和另一部门的数据保持一致;
  1. 产出形式单一: --数据产品和服务化
  • 离线的报表。

数据模型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值