hbase 二进制数据写入_(一)HBase基础

本文介绍了HBase的基础知识,包括其作为开源Bigtable的特性,如面向列存储、稀疏性和高可靠性。文章详细阐述了HBase的表结构,如命名空间、表、行键、列族和时间戳。此外,还探讨了HBase的架构,包括Client、Zookeeper、HMaster和HRegionServer的角色。最后,文章详细描述了HBase的数据读写流程,包括写流程中的WAL、MemStore和读流程中的Block Cache和MemStore Flush机制。
摘要由CSDN通过智能技术生成
1622f5db-c147-eb11-8da9-e4434bdf6706.svg 584b9d274ed479e7cd1430d73938b722.png 2122f5db-c147-eb11-8da9-e4434bdf6706.svg 2f3f3124c2dd7162b2e1b0ffd071935c.png
一、介绍

官网

1、基本概念

    hbase是bigtable的开源java版本,是建立在hdfs之上。提供高可靠性、高性能、列存储、可伸缩、实时读写nosql 数据库系统。它介于nosql和RDBMS之间,仅能通过主键(row key)和主键的range来检索数据,仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储结构化和半结构化的松散数据。Hbase查询数据功能很简单,不支持join等复杂操作,不支持复杂的事务(行级的事务),Hbase中支持的数据类型:byte[]与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。

2、特点          

大:一个表可以有上十亿行,上百万列        

面向列:面向列(族)的存储和权限控制,列(族)独立检索。     

稀疏:对于为空(null)的列,并不占用存储空间,因此,表可以设计的非常稀疏。

二、Hbase表结构

c8572f94447e1bdc01d5a2f90ef65f0c.png

命名空间(Name Space):

        类似于关系型数据库的 DatabBase 概念,每个命名空间下有多个表。HBase有两个自带的命名空间,分别是 hbase 和 default,hbase 中存放的是 HBase 内置的表,default 表是用户默认使用的命名空间。

表(table):

   用于存储管理数据,具有稀疏的、面向列的特点。HBase中的每一张表,就是所谓的大表(Bigtable),可以有上亿行,上百万列。对于为值为空的列,并不占用存储空间,因此表可以设计的非常稀疏。     

行键(RowKey):

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值