kudu笔记

1.Kudu是什么?

Apache Kudu是由Cloudera开源的存储引擎,可以同时提供低延迟的随机读写和高效的数据分析能力。它是一个融合HDFS和 HBase的功能的新组件,具备介于两者之间的新存储组件。 

Kudu支持水平扩展,并且与Cloudera Impala和Apache Spark 等当前流行的大数据查询和分析工具结合紧密。 

2.Apache Kudu架构

与HDFS 和 HBase相似,Kudu使用单个的Master节点,用来管理集群的元数据,并且使用任意数量的Tablet Server(类似HBase 中的RegionServer角色)节点用来存储实际数据。可以部署多个Master节点来提高容错性。

Master

1.Table

表(Table)是数据库中用来存储数据的对象,是有结构的数据集合。kudu中的表具有schema(纲要)和全局有序的primary key (主键)。kudu中一个table会被水平分成多个被称之为tablet的片段。 表(Table)是数据库中用来存储数据的对象,是有结构的数据集合.Kudu中的表具有模式(纲要)和全局有序的主键(主键))。中一个表会被水平分成多个被称之为平板的片段。

2.Tablet

一个tablet是一张table连续的片段,tablet是 kudu表的水平分区,类似于HBase的region。每个tablet存储着一定连续range的数据(key),且 tablet两两间的range不会重叠。一张表的所有tablet包含了这张表的所有key空间。 一个片是一张表连续的片段,片剂是kudu表的水平分区,类似于HBASE的区。每个平板存储着一定连续Range的数据(Key),且Tablet两两间的Range不会重叠。一张表的所有平板包含了这张表的所有Key空间。

tablet会冗余存储。放置到多个tablet server 上,并且在任何给定的时间点,其中一个副本被认为是leader tablet,其余的被认之为followertablet。每个tablet都可以进行数据的读请求,但只有Leader tablet负责写数据请求。 片剂会冗余存储。放置到多个平板服务器上,并且在任何给定的时间点,其中一个副本被认为是领导平板,其余的被认之为追随者平板。每个平板都可以进行数据的读请求,但只有先导平板电脑负责写数据请求。

3.Tablet Server

tablet server集群中的小弟,负责数据存储,并提供数据读写服务

4.Master Server

集群中的老大,负责集群管理、元数据管理等功能。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值