数据仓库dw层_每日一知-数据仓库

数据仓库(Data Warehouse)是集成多源数据的中央存储库,用于数据分析。它通常包括ODS、DW、DM和APP四层。ODS保存原始数据,DW构建维度和事实表,DM做轻度汇总,APP面向应用。数据来源包括日志采集、业务系统和爬虫数据。通过分层,可以清晰数据结构、减少重复开发、统一数据口径和简化复杂问题。
摘要由CSDN通过智能技术生成

作为一名数据分析师,每日处理大量数据,这些大量数据来自数据仓库,数据仓库里面太多太多表,什么用户信息表,订单表,产品信息表,订单明细表,评论表等等,五花八门,光是弄清楚每个表的含义和对应的字段含义,就很头大。

那么有没有什么好的方法弄清楚各个表的含义?如果数据仓库表命名规范,可以看出一些内藏玄机后面会讲到,但是我日常的处理方式就是把用到的表记录下来,记录的表多了,再归类一下。

由于日常工作涉及的很多表毕竟都是来自数仓工程师或者有的时候自己处理一下,我认为懂得数仓的概念还是对自己有意义的。这里介绍一下数据仓库的概念

数据仓库(Data Warehouse)是来自一个或多个不同源的集成数据的中央存储库,通过对数据仓库中的数据分析,可以帮助企业,改进业务流程,控制成本,提高产品质量等。数据仓库的两个主要功能:存储分析数据和处理分析数据。

ef8de0f6d7bb8a8d01bc65946ba74063.png

数据仓库的来源一般是日志采集,业务系统数据,爬虫等,数据仓库的用途一般用作报表系统,用户画像,推荐系统,风控系统。

什么是日志采集?记录用户的行为日志,用户搜索什么关键字,用户把什么产品加入了购物车,用户购买了什么产品,之后用于分析用户,做推荐系统做准备,数据

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值