《数据湖架构-Data Lake Architecture》精简
声明:本文仅代表一家之言。“单向”数据湖 业务用户对数据湖中数据感到一筹莫展,核心问题在于,湖中数据增长得越多,其分析难度也越大。因为数据被不断地推进湖中,分析报告却始终难产,这种规模可观的数据湖被戏虐为“单向”数据湖,数据只进不出。这样数据湖仅仅被当做一个倾斜数据的垃圾, “垃圾”数据湖至少有三个问题(1)有用的数据对于分析师来说会变得难以发现,因为它们被掩藏在堆积如山的不相关信息后面;(2)用来描述数据湖中数据个体的元数据(数据的数据)并没有被捕获或存...
转载
2021-08-14 15:01:05 ·
924 阅读 ·
0 评论