HBase
文章平均质量分 93
Ronnie@2019
苦练七十二变,笑对八十一难
展开
-
《HBase权威指南》读书笔记(二)
第9章 高级用法 9.1 行键设计 9.1.1 概念 HBase的表中的数据分割主要使用列族而不是列,这与一般的列式存储数据库的概念有所不同。 右上角的图片展示了逻辑布局如何转换为实际的物理存储布局。每一行的单元格被有序存储,同时不同列族的数据存储在不同文件中。换句话说,磁盘上一个列族下所有的单元格都存储在一个存储文件(store file)中,不同列族的单元格不会出现在同一个存储文件中。 因为HBase不存储任何在表中没有值的单元格(在RDBMS中,NULL可作为空值存储),磁盘文件中也只有这些已经有值原创 2021-06-07 20:19:40 · 249 阅读 · 2 评论 -
《HBase权威指南》读书笔记(一)
第8章 架构 8.1 数据查找和传输 8.1.1 B+树 B树的一些特性使其能够通过主键对记录进行高效插入、査找以及删除。它表示为一个动态、多层并有上下界的索引。同时要注意维护每一段(也被称作页表)所包含的主键数目。分段B+树的效果远好于二叉树的数据划分,其大大减少了查询特定主键所需的IO操作。 除此以外,B+树能够提供髙效的范围扫描功能,这得益于它的叶节点相互连接并且按主键有序,扫描时避免了耗时的遍历树操作。这也是B+树被关系型数据库用作索引的原因之一。 如果要进行一次范围査询,则可能需要读取多个在磁盘原创 2021-06-07 15:29:46 · 292 阅读 · 0 评论