HBASE_一流觞的博客-CSDN博客

HBASE

关注

文章平均质量分 76

本阶段介绍HBase 是一个分布式的、面向列的分布式数据库，HBase是基于Google 开源的bigtable的实现，面向列的非关系性数据库。在大数据分布式处理中，HBase是必不可少的数据存储“利器”。

关注数：文章数：5 文章阅读量：1187 文章收藏量：1

作者: 一流觞

这个作者很懒，什么都没留下…

展开

hbase 读写流程

大合并（major ）和小合并（minor ）：minor 合并负责重写最后生成的几个文件到一个更大的文件中。文件数量是由hbase.hstore.compaction.min 属性设置的。它的默认值为 3，并且最小值需要大于或等于 2。过大的数字将会延迟 minor 合并的执行，同时也会增加执行时消耗的资源及执行的时间。major 合并：它们把所有文件压缩成一个单独的文件。默认情况下，major 合并间隔是7 天，看情况随机的加上或减去 4.8 小时。如果要删除数据，不会直接修改 store

原创 2021-09-27 17:07:04 · 144 阅读 · 0 评论
hbase 数据模型进阶

rowkey cf1:q2 获取最新数据rowkey , CF1, q2, t2 四维数据库，获取指定列族指定列指定时间戳的数据rowkey 列族列名时间戳四个纬度row key决定一行数据按照字典顺序排序的。Row key 只能存储 64k 的字节数据(UTF-8 编码格式下 2.133w 多个汉字)Column Family 列族 & qualifier 列HBase 表中的每个列都归属于某个列族，列族必须作为表模式(schema)定义的一部分预先给出。 crea.

原创 2021-09-27 16:45:47 · 113 阅读 · 0 评论
HBASE搭建

HBASE的搭建搭建方式：独立模式、伪分布式、完全分布式实际上，您需要完全分布式配置才能完全测试 HBase 并在实际场景中使用它。在分布式配置中，群集包含多个节点，每个节点运行一个或多个 HBase 守护程序。其中包括主要和备用 Master，多个 Zookeeper 节点和多个 RegionServer 节点。1、配置四台主机免密钥2、将 hbase 解压到 node1 的/opt3、在/etc/profile 中配置 HBASE_HOME，并将 HBase 的 bin 目录添加到 PA

原创 2021-09-27 16:13:24 · 353 阅读 · 0 评论
HBASE的架构

1、如何看架构图1、看架构图中有哪些角色2、HBASE架构目录表 hbase:meta目录表 hbase:meta 作为 HBase 表存在，并从 hbase shell 的 list(类似 show tables)命令中过滤掉，但实际上是一个表，就像任何其他表一样。hbase:meta 表（以前称为.META.），保有系统中所有 region 的列表。hbase:meta位置信息存储在 zookeeper 中。hbase:meta 表是所有查询的入口表结构如下：key： region

原创 2021-09-27 11:13:01 · 92 阅读 · 0 评论
HBASE的描述

1、HBASE的介绍Apache HBase™是 Hadoop 数据库，是一个分布式、可伸缩、大数据存储区。当您需要随机、实时读/写访问大数据时，请使用 Apache HBase™。该项目的目标是在商用硬件集群之上托管非常大的表----数十亿行X百万列。Apache HBase是一个开源的、分布式的、版本化的、非关系的数据库，它参考了 Google 的Bigtable。正如 Bigtable 利用 Google 文件系统提供的分布式数据存储一样，Apache HBase 在 Hadoop 和 HDFS

原创 2021-09-27 10:26:12 · 487 阅读 · 0 评论

HBASE

作者: 一流觞

hbase 读写流程

hbase 数据模型进阶

HBASE搭建

HBASE的架构

HBASE的描述