数据仓库的基本架构

数据仓库通过ETL过程从源数据中抽取、转换、加载数据。它包含数据来源、数据存储、数据聚合等模块,如点击流日志、数据库数据。数据仓库以面向主题的方式存储细节数据,提供报表展示、即席查询、数据分析和数据挖掘等功能。元数据管理确保设计、部署和管理的一致性。
摘要由CSDN通过智能技术生成

数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持( Decision Support)。

数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层——源数据、 数据仓库、 数据应用。


数据仓库从各数据源获取数据及在数据仓库内的数据转换和流动都可以认为是 ETL (抽取 Extra, 转化 Transfer, 装载 Load)的过程, ETL 是数据仓库的流水线,数据仓库日常的管理和维护工作的大部分精力就是保持 ETL 的正常和稳定。


数据仓库中的各个模块:

数据来源:点击流日志是一块主要的数据来源,它是网站分析的基础数据;当然网站的数据库数据也并不可少,其记录这网站运营的数据及各种用户操作的结果,对于分析网站 Outcome

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值