Apache Kudu 学习

Apache Kudu 学习

一、背景

HDFS:吞吐能力极强,但是随机读写能力差,适合进行批处理数据分析

HBase:随机读写能力极强,但是吞吐能力差,适合做随机分析处理。

kudu:它是一个介入HDFSHbase之间的存储引擎。可以同时提供低延迟的随机读写和高效的数据分析能力。

此外,kudu支持水平扩展,并且与 ImpalaSpark 等当前流行的大数据查询和分析工具结合紧密。

二、kudu架构

HDFSHBase类似,kudu 使用单个的 Master 节点,用来管理集群的元数据,并且使用任意数量的 Tablet Server(类似Hbase 的 RegionServer角色)节点来 存储实际数据。也可以部署多个 Master节点来提高容错性,高可用性。

  1. Master:管理集群,维护kudu元数据。
  2. Table:表(Table)是数据库中用来存储数据的对象,是有结构的数据集合,kudu中的表具有 schema(纲要)和全局有序的 Primary key(主键)。kudu中一个 table 会被水平切分成多个称之为 tablet 的片段。
  3. Tablet:一个tablet 是一张 table 连续的片段,tablet是 kudu表的水平切分,类似于 Hbase 的Region。每个tablet 存储着一定连续 range 的数据(key),且tablet 两两之间的 range 不会重叠。一张表的所有 tablet 包含了这张表的所有 key 空间。
  4. Tablet Server:负责最终数据的存储,并且对外提供读写能力。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值