初步了解数据仓库

数据仓库是一种面向商务智能(B)活动(尤其是分析)的数据管理系统,它仅适用于查询和分析,通常涉及大量的历史数据。在实际应用中,数据仓库中的数据一般来自应用日志文件和事务应用等广泛来源。

数据仓库能够集中、整合多个来源的大量数据,借助数据仓库的分析功能,企业可从数据中获得宝贵的业务洞察,改善决策。同时,随着时间推移,它还会建立一个对于数据科学家和业务分析人员极具价值的历史记录。得益于这些强大的功能,数据仓库可为企业提供一个“单一信息源”。

一个数据仓库通常包含以下要素

一个用于存储和管理数据的关系数据库

一个用于分析前数据准备的提取、加载和转换(ELT)解决方案

统计分析、报告和数据挖掘功能

用于数据可视化和展现的客户端分析工具

其他更复杂的分析应雨通过应用数据科学和人工智能(AI) 算法或图形和空间功能来生成切实可行的信息,从而支持对数据进行更多类型的大规模分析

企业还可以在一个MySQL Database服务中集成集事务处理、实时分析(数据仓库和数据湖)和机器学习功能,消除ETL (提取、转换、加载)复制的复杂性、延迟、成本和风险。

数据仓库的特点

面向主题:数据仓库可以高效分析关于特定主题或职能领域(例如销售)的数据。

集成:数据仓库可在不同来源的不同数据类型之间建立一致性。

相对稳定:进入数据仓库后,数据将保持稳定,不会发生改变。

反映历史变化:数据仓库分析着眼于反映历史变化。

数据仓库的架构取决于企业的需求。通用数据仓库架构具有以下特点:

简单:所有数据仓库都采用同基本设计,将元数据、概要数据和原始数据全部存储在中央信息库中。信息库-端由数据源馈送信息,另端则供最终用户访问,以便进行分析、报告和数据挖掘。

通过暂存区简化数据准备:将操作型数据置入数据仓库之前,必须首先进行清理和处理。这步骤可通过编程方式完成,但很多数据仓库会创建一个暂存区来简化数据准备工作。

星型结构:通过在中央信息库和最终用户之间创建数据集市,企业可以对数据仓库进行自定义,灵活满足各种业务线的需求。换言之,准备就绪后,数据不会立即进入数据仓库,而是会被移至适当的数据集市。

沙盒:沙盒可提供一个专有的安全区域,帮助企业快速、非正式地探索新的数据集或新的数据分析方式,而无需遵守或遵循数据仓库的正式规则和协议。

云数据仓库

云数据仓库使用云技术来提取和存储不同数据源的数据。

云数据仓库可提供以下优势:

提供弹性的可扩展支持,可满足大型或可变计算或存储需求、简单易用、易于管理、节约成本

  • 6
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值