数据湖概述

define_us

已于 2022-01-19 19:32:43 修改

阅读量1.6k

点赞数

文章标签： hadoop

于 2022-01-18 14:39:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/define_us/article/details/122559763

版权

数据湖是一种存储。
和传统数据仓库对比

特征	数据仓库	数据湖
数据	来自事务系统、运营数据库和业务线应用程序的关系数据	来自 IoT 设备、网站、移动应用程序、社交媒体和企业应用程序的非关系和关系数据
schema	设计在数据仓库实施之前（写入型 Schema）	写入在分析时（读取型 Schema）
性价比	更快查询结果会带来较高存储成本	更快查询结果只需较低存储成本
数据质量	可作为重要事实依据的高度监管数据	任何可以或无法进行监管的数据（例如原始数据）
用户	业务分析师	数据科学家、数据开发人员和业务分析师（使用监管数据）
使用场景	批处理报告、BI 和可视化	机器学习、预测分析、数据发现和分析

数据湖的解决方案主要有三种

delta（背后是spark开发公司Databricks）
Apache Iceberg（NetFlix推出的）
Apache Hudi（Ubser推出的）

在这里插入图片描述
ORC是hadoop生态圈的一种底层列式文件存储格式，HIVE的表就是按照ORC格式进行存储的。
iceberg实际上是上述的table format层。

数据写入ICEberg可以参考
https://blog.csdn.net/wypblog/article/details/109882022
iceberge的存储结构如下
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据湖概述

数据湖的解决方案主要有三种delta（背后是spark开发公司Databricks）Apache Iceberg（NetFlix推出的）Apache Hudi（Ubser推出的）
复制链接

扫一扫

define_us CSDN认证博客专家 CSDN认证企业博客

码龄12年

530: 原创

3万+: 周排名

2万+: 总排名

72万+: 访问

: 等级

1万+: 积分

150: 粉丝

139: 获赞

73: 评论

589: 收藏

私信

关注

热门文章

分类专栏

java多线程 27篇
spring 4篇
规则引擎 1篇
c++ 31篇
MFC和.NET 3篇
MATLAB 3篇
fpga开发 3篇
行业概况 19篇
网络 19篇
操作系统和编译器 42篇
声学常识和数学 19篇
系统分析 39篇
python 9篇
java 221篇
网络安全 6篇
dsp开发 4篇
c# 14篇
数据库 38篇
算法 37篇
superset 1篇
运维技术 2篇
前端 5篇
大数据技术 14篇
故障排查 10篇
我们爱历史 6篇
环境搭建 6篇
服务开发 5篇
容器 2篇

最新评论

Springboot中的起步依赖和自动装配
CSDN-Ada助手: Java 技能树或许可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
负载均衡和高可用
CSDN-Ada助手: 你的文章跟这一篇有什么区别，[负载均衡](https://edu.csdn.net/skill/cloud_native/cloud_native-80dec61abcca4348a6fdc9b9b727b486?typeId=22476)
SPI和类加载器
CSDN-Ada助手: 怎么在浏览器里面修改头信息呀
JAVA中的单例模式
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性；(3)增加除了各种控件外，文章正文的字数。
Spring生命周期中的常见接口
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。