1.数据仓库的概念及用途
数据仓库是来自一个或多个不同源的集成数据的中央存储库。数据仓库将当前和历史数据存储在一起,用于为整个企业的员工创建分析报告。
2.数据分层处理
典型的基于提取,转换,加载的数据仓库使用分级,数据集成和访问层来存放其关键功能。
3.数据仓库的目的
数据的主要来源被清理、转换、分类,并提供给管理人员和其他商业专业人员用于数据挖掘、在线分析处理、市场研究和决
策支持。 然而,检索和分析数据、提取、转换和装载数据以及管理数据字典的方法也被认为是数据仓库系统的基本组成部分。
许多数据仓库的文献都使用了这个更广泛的语境。因此,数据仓库的扩展定义包括商业智能工具、提取、转换和加载数据到
存储库的工具,以及管理和检索元数据的工具。
4.数据仓库与数据集市的关系
数据集市是一种数据仓库,用于满足特定团队或业务部门(例如财务、营销或销售)的需求。它更小、
更集中,并且可能包含最适合其用户社区的数据汇总。
5.数据仓库与数据库
数据仓库是专门为数据分析设计的,涉及读取大量数据以了解数据之间的关系和趋势。数据库用于捕
获和存储数据,例如记录事务的详细信息。
6.数据仓库与数据湖
与数据仓库不同,数据湖是所有数据(包括结构化和非结构化数据)的中央存储库。数据仓库利用针对分析进行了
优化的预定义 Schema。数据湖中未定义 Schema,支持其他类型的分析,例如大数据分析、全文搜索、实时分析
和机器学习。Sch(示意图例如,用于乘客的地铁地图可以用点表示地铁站。该点根本不打算类似于实际的测站;)
7.怎样搭建数据仓库的产品结构
8.电商构建数据仓库结构图