HBASE
文章平均质量分 76
本阶段介绍HBase 是一个分布式的、面向列的分布式数据库,HBase是基于Google 开源的bigtable的实现,面向列的非关系性数据库。在大数据分布式处理中,HBase是必不可少的数据存储“利器”。
一流觞
这个作者很懒,什么都没留下…
展开
-
hbase 读写流程
大合并 (major ) 和小合并 (minor ) :minor 合并负责重写最后生成的几个文件到一个更大的文件中。文件数量是由hbase.hstore.compaction.min 属性设置的。它的默认值为 3,并且最小值需要大于或等于 2。过大的数字将会延迟 minor 合并的执行,同时也会增加执行时消耗的资源及执行的时间 。major 合并:它们把所有文件压缩成一个单独的文件。默认情况下,major 合并间隔是7 天,看情况随机的加上或减去 4.8 小时。如果要删除数据,不会直接修改 store原创 2021-09-27 17:07:04 · 144 阅读 · 0 评论 -
hbase 数据模型进阶
rowkey cf1:q2 获取最新数据rowkey , CF1, q2, t2 四维数据库,获取指定列族指定列指定时间戳的数据rowkey 列族 列名 时间戳 四个纬度row key决定一行数据按照字典顺序排序的。Row key 只能存储 64k 的字节数据(UTF-8 编码格式下 2.133w 多个汉字)Column Family 列族 & qualifier 列HBase 表中的每个列都归属于某个列族,列族必须作为表模式(schema)定义的一部分预先给出。 crea.原创 2021-09-27 16:45:47 · 113 阅读 · 0 评论 -
HBASE搭建
HBASE的搭建搭建方式:独立模式、伪分布式、完全分布式实际上,您需要完全分布式配置才能完全测试 HBase 并在实际场景中使用它。在分布式配置中,群集包含多个节点,每个节点运行一个或多个 HBase 守护程序。其中包括主要和备用 Master,多个 Zookeeper 节点和多个 RegionServer 节点。1、配置四台主机免密钥2、将 hbase 解压到 node1 的/opt3、在/etc/profile 中配置 HBASE_HOME,并将 HBase 的 bin 目录添加到 PA原创 2021-09-27 16:13:24 · 353 阅读 · 0 评论 -
HBASE的架构
1、如何看架构图1、看架构图中有哪些角色2、HBASE架构目录表 hbase:meta目录表 hbase:meta 作为 HBase 表存在,并从 hbase shell 的 list(类似 show tables)命令中过滤掉,但实际上是一个表,就像任何其他表一样。hbase:meta 表(以前称为.META.),保有系统中所有 region 的列表。hbase:meta位置信息存储在 zookeeper 中。hbase:meta 表是所有查询的入口表结构如下:key: region原创 2021-09-27 11:13:01 · 92 阅读 · 0 评论 -
HBASE的描述
1、HBASE的介绍Apache HBase™是 Hadoop 数据库,是一个分布式、可伸缩、大数据存储区。当您需要随机、实时读/写访问大数据时,请使用 Apache HBase™。 该项目的目标是在商用硬件集群之上托管非常大的表----数十亿行X百万列。Apache HBase是一个开源的、分布式的、版本化的、非关系的数据库,它参考了 Google 的Bigtable。 正如 Bigtable 利用 Google 文件系统提供的分布式数据存储一样,Apache HBase 在 Hadoop 和 HDFS原创 2021-09-27 10:26:12 · 487 阅读 · 0 评论