数据仓库、数据集市、数据湖、传统的数据库

数据仓库与数据湖

当企业从运营系统获得大量数据可用于分析时,他们通常会选择数据仓库或数据湖泊。数据仓库通常作为单一数据源,存储着经过清理和分类的历史数据。数据库中的数据可能不准确,并可能来自企业运营系统之外,它并不适合普通业务分析用户。实际的仓库和湖泊:仓库存储来自特定来源的计划好的货物,而湖泊来自河流、溪流和其他来源,且都是原始内容。

数据仓库和数据集市
数据集市通常是数据仓库的子集,其中的数据通常来自数据仓库—尽管可能来自其他来源。发送到数据集市的数据主要是针对特定用户群(例如销售团队)并经过整理,以便用户能够快速找到所需数据。这些数据用于特定目的,例如财务分析。数据集市比数据仓库小得多,只有数十亿字节,而数据仓库可容纳数百千兆字节到数拍字节数据。 数据集市可从现有数据仓库或其他数据源系统构建,通过设计和构建数据库表,使用相关数据填充数据表并决定谁可以访问它即可。

关系型数据库与数据仓库及数据湖
数据仓库和数据湖与关系型数据库系统的主要区别在于,关系型数据库用于存储和整理来自单个来源(例如事务系统)的结构化数据,而数据仓库用于保存来自多个来源的结构化数据。数据湖的不同之处在于它可存储非结构化、半结构化和结构化数据。 关系型数据库创建起来相对简单,可用于存储和整理事务数据。关系型数据库的缺点是它们不支持非结构化数据或现在生成的大量数据。这让我们需要在数据仓库和数据湖中做出选择。尽管如此,很多企业仍然依赖关系型数据库来完成运营数据分析或趋势分析等任务。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值