数据仓库,数据湖

1. 数据仓库

早期系统采用数据库来管理和存放数据,但随着大数据技术的兴起,大家想要通过大数据技术来找到数据之间可能存在的关系,所以大家设计了一套新的数据存储管理系统,把所有的数据全部存储到数据仓库,然后统一对数据处理,这个系统叫做数据仓库。

数据仓库是来自一个或者多个不同源的集成数据中央存储库。

数据仓库将当前和历史数据存储在一起,以利于各种分析方法如在线分析处理(OLAP),数据挖掘(data mining),帮助决策者能快速从大量的数据中,分析西湖有价值的信息,帮助构建商业智能(BI).

尽管仓库非常适合存储结构化数据,但是许多现在企业必须处理非结构化数据,半结构化数据以及具有高多样性,高速度和高容量的数据。数据仓库不适用于许多此类场景,并且成本效益并非最佳。

数据湖的出现是为了弥补数据仓库只能存储结构化数据的缺陷,数据湖的种类比较丰富可以包罗万象。

数据仓库更加适合成熟的数据当中的分析和处理,数据湖更加适合在异构数据上的价值的挖掘。

数据湖虽然适合存储数据,但是缺少一些关键的功能:他不支持事务处理,不保证数据质量,并且缺乏一致性/隔离性,从而几乎无法实现混合追加和读取数据,以及完成批处理和流式作业。

湖仓一体化为什么诞生?

数据仓库只能处理单一的结构化数据,对于在线的事务分析处理非常实用。但是现在很多公司对各类数据应用包括SQL分析,实时监控,数据科学和机器学习的灵活性、高性能系统的需求并未减少

AI的大部分最新进展是基于更好地处理非结构化数据(如text、images、video、audio)的模型,完全纯数据仓库的二维关系表已经无法承接半/非结构化数据的处理,AI引擎不可能只跑在纯数据仓库模型上。

结合数据仓库和数据湖优势,建立互藏一体化,进而解决数据湖和数据仓库的局限性:直接在用于数据湖的低成本存储上实现与数据仓库中类似的数据结构和数据管理功能。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据中台、数据仓库数据湖是数据管理领域中的三个重要概念。 数据仓库是一个用于集成、存储和管理企业数据的中心化系统。它经过清洗、转换和整合后,按照统一的标准规范进行存储,以支持企业的决策和分析需求。数据仓库通常采用结构化数据,并具有明确定义的模式和架构。\[1\] 数据湖是一个用于存储各种形式和格式的原始数据的系统,包括结构化和非结构化数据,如文本、音频、视频和图像。与数据仓库相比,数据湖更加灵活,并且不要求事先定义模式。数据湖适合用于机器学习、深度学习、数据挖掘和数据分析等任务,以及提取非结构化数据。\[2\] 数据中台是指在数字化转型过程中,将企业内部和外部的各种数据源整合到一个中心平台上,以实现数据的共享、集成和管理。数据中台的建设是数字化转型的关键支撑,它能够提供数据的一致性、准确性和实时性,以支持企业的业务决策和创新。\[3\] 综上所述,数据中台、数据仓库数据湖在数据管理中有不同的角色和功能。数据仓库用于集成和管理结构化数据,数据湖用于存储各种形式和格式的原始数据,而数据中台则是整合和管理各种数据源的中心平台。 #### 引用[.reference_title] - *1* *2* [数据仓库数据湖、数据平台和数据中台的概念和区别](https://blog.csdn.net/m0_56143415/article/details/122706613)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [数据仓库数据湖、数据中台](https://blog.csdn.net/cai_and_luo/article/details/106505193)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值