湖仓一体架构构建与平台应用实践(PPT)

数据仓库适合存储结构化的、信息密度高的、经过处理后的数据。例如我们通过大数据分析得到的关联信息、画像信息等,都可以放在数据仓库中。

“仓库”一词也将它的特点表现得清清楚楚。仓库,东西要放在规整的货架上,甚至还会给货架编号。这里的数据很规范,用起来没那么灵活。

数据湖适合存储非结构化的、信息密度低的、未经清洗的数据。例如生产中我们获取到的日志信息、长文本信息等都可以直接放到数据湖中。

曾经有一段时间,大家对于大数据的存储形式分裂为了两派。不断询问是选择数据湖,还是选择数据仓库?

选择数据湖,才能拥有数据的多样与灵活,有利于将不同的数据组合在一起,发现新的规律。选择数据仓库,才能拥有数据的规范与清晰,有利于数据的便捷使用,也利于数据的长时间存储。

湖仓一体,即打通数据仓库和数据湖两套体系,让数据和计算在湖和仓之间自由流动,从而构建一个完整的有机的大数据技术生态体系。这就像是在你的面前放了一个摆满了文档的书桌(数据湖),也放了一个小书架(数据仓库)。于是两者的数据以随意获取,在灵活与规范之间取得了平衡。

a214e642a59260eb4a3e86472f10b8d1.png

下面这份PPT材料来自DAMA中国,专题分享活动《湖仓一体,构建企业数字化新基座》,作者数据科学家毛亮坚老师,主要介绍了大数据平台架构演进、详细阐述湖仓一体架构构建与探索思路、湖仓一体化平台应用实践案例、最后提出了湖仓一体化平台未来发展趋势,推荐给大家阅读。

6c17221d438482d43501ab37d683e7ec.png

2d3e875377698b4a8c669079617f9325.png

0e68bf1cdd6917d359f2c8283f9b891f.png

9b0630c8b402745b42258c7601a0d62f.png

594d37e68b416c417d9347f15d94aac6.png

2eb25c88ebb31dec59c489e10c4730ba.png

93d9aeaffa5f5bbb6bc7daf59f4e25bc.png

80aa1053d75972f5f45ea9c37f286367.png

88910e301ff736a6aa33c6934b58de91.png

680ad885ce458251296d1aed81b44532.png

76cb90b8e8fdc6b719f333433fc2b654.png

e30c058e7ca593bc606d6cf96a34ef3b.png

75fd0c8ce98a917e59f2c59fec7122f2.png

8dcf23f82bfc5fb75f7d8840e154b5ff.png

d93380da9c90cc37e877c4d5e07c0386.png

05e4c2d7be1c9396e1c43c45245d850d.png

e3616bf6350306dbcce26da44133c2c3.png

77318e9c68e4a1573fdf5108ef91492a.png

1a9c2da8b16e838f6466043c4c7a0b53.png

dbeb639d68bed0f93cc027a52fe073c3.png

8c5c9cd01a0f9cddc98d33949c34970d.png

a2c90bdd6b45fd59c50cc364cf99e12b.png

6822ac91a508194ac8daf7c824cecc2e.png

f732eb9b282359a8bf5e2bff867f01c1.png

5041d9d122420052250a75f07f1975d2.png

05976af85c5cc4c58934da6adb232066.png

57222ff92765d59a332a6ba1e6c78246.png

68f51f46c84da52b0a2b65fda68d4c31.png

b19ac6b657bb52c14d07257540c22568.png

b96432e8989ff32d0520eb045e5a6187.png

64e92e6a4b4e6e24972a5ebde2cd2f1f.png

e4d33cb1dce476c5f61231f3b87584a0.png

4eee722566b0456a70a35ac4987496ba.png

d742f82b0ed4aeef83671f2c53651b6b.png

cb6a6a60377857eb380527492ff86b99.png

e50de0336a95bf1ba16f0f9b996f67f9.png

961939b46a50f8781be6765d9b7194fa.png

a9bbb6a45c05d5b5a623756cd1e58a64.png

5db1fd2039c96a5dbba83f2a118c1bd1.png

12f5987f843700642001e3af47bf4986.png

6c3facb786fbc5bc677c85a6244c3c2e.png

1cbb8bf05dd287545e4f675d3c246fd1.png

 
 
推荐阅读:
世界的真实格局分析,地球人类社会底层运行原理
不是你需要中台,而是一名合格的架构师(附各大厂中台建设PPT)

企业IT技术架构规划方案

论数字化转型——转什么,如何转?

华为干部与人才发展手册(附PPT)

企业10大管理流程图,数字化转型从业者必备!

【中台实践】华为大数据中台架构分享.pdf

华为的数字化转型方法论

华为如何实施数字化转型(附PPT)

超详细280页Docker实战文档!开放下载

华为大数据解决方案(PPT)
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值