HBase
王义凯_Rick
如果对你有帮助,就请点个赞吧~
展开
-
HBase系列(四)、HBase优化之RowKey 设计
上一篇中我们提到了HBase的读写原理,可以看出HBase是为写操作优化,更适合写多读少的场景,尤其是因为数据按列族和Region切分成一个个的StoreFile,在跨多文件查询数据的时候就会很慢。同时,由于Region切分策略,会让HFile出现数据倾斜的情况,因此我们在实际应用中首先要先设置预分区,指定HBase表有几个分区,每个分区内的RowKey范围,然后我们只要将RowKey的值尽可能均匀的放置在这些Region内即可。本篇我们就来介绍如何通过RowKey的设计提升HBase的读性能。原创 2020-09-11 16:07:48 · 1636 阅读 · 0 评论 -
HBase系列(三)、读写原理,Flush刷写,HFile Compact合并,Region Split切分
本篇内容介绍Hbase的读写原理及Flush,Compact,Split原理。为Hbase系列的第三篇。HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase可在廉价服务器上搭建起大规模结构化存储集群。是Apache软件基金会的Hadoop项目的一部分,运行于HDFS文件系统之上,因此可以容错地存储海量稀疏的数据。HBase是一个开源的非关系型分布式数据库(NoSQL),它参考了谷歌的BigTable建模,使用Java语言进行实现。但是也有很多不同之处原创 2020-09-11 02:35:07 · 1252 阅读 · 0 评论 -
HBase系列(二)、架构原理
本篇内容介绍Hbase的架构原理。为Hbase系列的第二篇。HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase可在廉价服务器上搭建起大规模结构化存储集群。是Apache软件基金会的Hadoop项目的一部分,运行于HDFS文件系统之上,因此可以容错地存储海量稀疏的数据。HBase是一个开源的非关系型分布式数据库(NoSQL),它参考了谷歌的BigTable建模,使用Java语言进行实现。但是也有很多不同之处原创 2020-09-10 14:54:56 · 695 阅读 · 1 评论 -
HBase系列(一)、数据模型
本篇内容介绍Hbase的数据模型。为Hbase系列的第一篇。HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase可在廉价服务器上搭建起大规模结构化存储集群。是Apache软件基金会的Hadoop项目的一部分,运行于HDFS文件系统之上,因此可以容错地存储海量稀疏的数据。HBase是一个开源的非关系型分布式数据库(NoSQL),它参考了谷歌的BigTable建模,使用Java语言进行实现。但是也有很多不同之处原创 2020-09-10 00:35:10 · 1635 阅读 · 0 评论 -
在Hive中操作Phoenix,对比Hive查询Hbase
前面介绍过通过Phoenix操作HBase,实现了hbase的SQL语义,以及查询性能的提升,也对比过使用hive查hbase和使用phoenix查hbase的性能,也介绍了如何在hive中查询ES,那么今天我们就尝试在hive中查phoenix。也就是hbase-->Phoenix-->hive这样的链路。原创 2020-06-05 14:18:48 · 2296 阅读 · 0 评论