数据湖与数据仓库的区别

13 篇文章 2 订阅
5 篇文章 0 订阅

title: 数据湖与数据仓库的区别
date: 2022-01-18 23:39:42
tags: [数据仓库,数据湖]
categories: 数据湖

什么是数据湖?什么是数据仓库?

数据湖是一个存储企业的各种各样原始数据的大型仓库,其中的数据可供存取、处理、分析及传输。

数据湖从企业的多个数据源获取原始数据,并且针对不同的目的,同一份原始数据还可能有多种满足特定内部模型格式的数据副本。因此,数据湖中被处理的数据可能是任意类型的数据,从结构化数据到完全非结构化数据。

数据湖能给企业带来多种能力,例如,实现数据的集中式管理,在此之上,企业能挖掘出很多之前所不具备的能力。

长期以来,企业一直企图找到一个统一的模型来表示企业中所有实体,这个任务有极大的挑战性,原因有很多,这里举了其中一部分原因:
1.一个实体有可能在企业中有多种表示形式,因此可能不存在某个完备的模型来统一表示实体。
2.不同的企业应用程序可能会基于特定的商业目标来处理实体,这意味着处理实体时,会采用或者排斥某些企业流程。
3.不同应用程序可能会对每个实体采用不同的访问模式及存储结构。

数据仓库就是针对企业的应用程序数据存储,它有统一的标准,统一的格式存储,基本都是格式化数据。


Keep reading, Keep writing, Keep coding.

欢迎关注我的微信公众号,比较喜欢分享知识,也喜欢宠物,所以做了这2个公众号:
程序员写书

喜欢宠物的朋友可以关注:【电巴克宠物Pets】
电巴克宠物

一起学习,一起进步。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

chenzuoli

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值