kudu
worldchinalee
这个作者很懒,什么都没留下…
展开
-
Kudu:支持快速分析的新型Hadoop存储系统
Kudu 是 Cloudera 开源的新型列式存储系统,是 Apache Hadoop 生态圈的新成员之一( incubating ),专门为了对快速变化的数据进行快速的分析,填补了以往 Hadoop 存储层的空缺。本文主要对 Kudu 的动机、背景,以及架构进行简单介绍。 背景——功能上的空白 Hadoop 生态系统有很多组件,每一个组件有不同的功能。在现实场景中,用户往往需...转载 2018-09-11 14:32:09 · 349 阅读 · 0 评论 -
kudu tablet design
Tablet是kudu表的水平分区,类似于google Bigtable的tablet,或者HBase的region。每个tablet存储着一定连续range的数据(key),且tablet两两间的range不会重叠。一张表的所有tablet包含了这张表的所有key空间。 Tablet由RowSet组成,RowSet由一组rows组成(n条数据、n行数据)。RowSet是不相交的,即不同的Row...转载 2018-09-30 10:06:14 · 802 阅读 · 0 评论