数据仓库技术概述
目录
一、数据仓库的定义
数据仓库是一种面向商务智能 (BI) 活动(尤其是分析)的数据管理系统,它仅适用于查询和分析,通常涉及大量的历史数据。在实际应用中,数据仓库中的数据一般来自应用日志文件和事务应用等广泛来源。
数据仓库能够集中、整合多个来源的大量数据,借助数据仓库的分析功能,企业可从数据中获得宝贵的业务洞察,改善决策。同时,随着时间推移,它还会建立一个对于数据科学家和业务分析人员极具价值的历史记录。得益于这些强大的功能,数据仓库可为企业提供一个“单一信息源”。
一个数据仓库通常包含以下要素:
1.一个用于存储和管理数据的关系数据库
2.一个用于分析前数据准备的提取、加载和转换 (ELT) 解决方案
3. 统计分析、报告和数据挖掘功能
4.用于数据可视化和展现的客户端分析工具
二、数据仓库的优势
数据仓库在高效分析大量不同的数据,提取数据价值并保留历史记录方面拥有独一无二的强大优势。 数据仓库之父兼计算机科学家 William Inmon 定义了数

本文详细介绍了数据仓库的定义、优势,包括其面向主题、集成和历史记录等特点,以及架构的通用设计和现代趋势,如云数据仓库的弹性与便利性。还涵盖了现代数据仓库的融合数据库、自助式ETL等关键组件。
最低0.47元/天 解锁文章
2180

被折叠的 条评论
为什么被折叠?



