Kudu（分布式数据存储引擎）

最新推荐文章于 2024-09-18 05:15:00 发布

砸锅卖铁上论坛

最新推荐文章于 2024-09-18 05:15:00 发布

阅读量1.5k

点赞数 1

分类专栏： Kudu 分布式数据存储引擎文章标签：大数据 hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31641743/article/details/106720197

版权

Kudu是cloudera开源的列式存储系统，适用于Hadoop平台，支持随机读写和OLAP分析。文章介绍了Kudu的基本概念，如Table、Tablet、Tablet Server和Master，以及其架构和数据模型，强调了Kudu在列式查询、随机更新和稳定性能上的优势。

摘要由CSDN通过智能技术生成

Kudu（分布式数据存储引擎）

Kudu是cloudera开源的运行在hadoop平台上的列式存储系统,拥有Hadoop生态系统应用的常见技术特性，运行在一般的商用硬件上，支持水平扩展,高可用。

kudu 定位是「Fast Analytics on Fast Data」，是一个既支持随机读写、又支持 OLAP 分析的大数据存储引擎。

原数据存储于HDFS或HBase都有优缺点：

直接存放于HDFS中，适合离线分析，却不利于记录级别的随机读写。
直接将数据存放于HBase/Cassandra中，适合记录级别的随机读写，对离线分析却不友好。

1、基本概念

Table

table 是数据存储在 Kudu 的位置，具有 schema 和全局有序的 primary key。table 被分成称为 tablets 的 segments。

Tablet

一个 tablet 是一张 table 连续的 segment，与其它数据存储引擎或关系型数据库中的 partition（分区）相似。给定的 tablet 冗余到多个 tablet 服务器上，并且在任何给定的时间点，其中一个副本被认为是 leader tablet。任何副本都可以对读取进行服务，并且写入时需要在为 tablet 服务的一组 tablet server之间达成一致性。

Tabl

最低0.47元/天解锁文章

砸锅卖铁上论坛

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。