离线电商数仓-用户行为采集平台-第1章 数据仓库概念

前言提示

本博客是学习记录,可能存在错误,仅供参考。
如发现错误,欢迎在评论区指正,我会及时修改。
同时也希望大家能在评论区多和我讨论(例如帮助我解决文中的#疑问),或者私信我,讨论可以让我们学习效率一起变得更高。
现在的版本不是最终版本,我会在学习过程中不断地更新。

第1章 数据仓库概念

1.简介

数仓仓库是为企业制定决策,提供数据支持

数仓仓库不是数据的最终目的,数据进入仓库后,需要进行计算分析,形成各种指标,然后展示提供给需要的人。

2.数据分类

数据仓库的输入数据:业务数据,用户行为数据和爬虫数据

image-20221014150130763

业务数据有统一的特点就是响应快,可用关系型数据库MySql存储

用户行为数据需要埋点收集,数据量比较大,可以用日志文件进行存储

爬虫数据可能触犯法律

3.数仓总体简介

源数据层(ODS)做数据的备份,防止一些误操作,把原数据删除或者覆盖了。

明细数据层(DWD)对数据进行清洗

服务数据层(DWS)对数据进行预聚合操作,将大表之间提前join好,形成中间表,避免一些大表的多次join,方便指标的统计。

数据维度层(DIM)和DWT的区别#疑问

ADS层是统计各种指标的

DM和ADS的区别#疑问

image-20221014154007611

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值