CC00001.hbase——|Hadoop&HBase.V01|——|HBase.v01|概述.v01|

HBase是一个基于Google BigTable理念设计的分布式列式非关系型数据库,适用于海量数据的实时随机读写。它利用列式存储减少存储空间,支持高并发读写,并具备稀疏性,允许灵活指定任意多的列。HBase广泛应用于交通、金融、电商、电信等领域,尤其适合存储和查询海量明细数据场景。
摘要由CSDN通过智能技术生成
一、HBase 简介
### --- [HBase]

~~~     [HBase简介之HBase是什么]
~~~     [HBase简介之HBase特点及应用场景]
~~~     [HBase数据模型]
~~~     [HBase整体架构]
### --- HBase是什么

~~~     HBase 基于 Google的BigTable论文而来,是一个分布式海量列式非关系型数据库系统,
~~~     可以提供超大规模数据集的实时随机读写。
~~~     接下来,通过一个场景初步认识HBase列存储;如下MySQL存储机制,空值字段浪费存储空间
idNAMEAGESALARYJOB
1小明23学生
2小红10w律师
### --- 如果是列存储的话,可以这么玩......

rowkey:     1       name:           小明
rowkey:     1       age:            23
rowkey:     1       job:            学生
rowkey:     2       name:           小红
rowkey:     2       salary:         10w
rowkey:     2       job:            律师
....
### --- 列存储的优点:

~~~     减少存储空间占用。
~~~     支持好多列
二、HBase的特点
### --- HBase的特点

~~~     # 海量存储: 
~~~     底层基于HDFS存储海量数据
~~~     # 列式存储:
~~~     HBase表的数据是基于列族进行存储的,一个列族包含若干列
~~~     # 极易扩展:
~~~     底层依赖HDFS,当磁盘空间不足的时候,只需要动态增加DataNode服务节点就可以高并发:
~~~     支持高并发的读写请求
~~~     # 稀疏:
~~~     稀疏主要是针对HBase列的灵活性,在列族中,你可以指定任意多的列,
~~~     在列数据为空的情况下,是不会占用存储空间的。
~~~     # 数据的多版本:
~~~     HBase表中的数据可以有多个版本值,默认情况下是根据版本号去区分,
~~~     版本号就是插入数据的时间戳
~~~     # 数据类型单一:
~~~     所有的数据在HBase中是以字节数组进行存储
三、HBase的应用
### --- HBase的应用

~~~     # 交通方面:
~~~     船舶GPS信息,每天有上千万左右的数据存储。
~~~     # 金融方面:
~~~     消费信息、贷款信息、信用卡还款信息等
~~~     # 电商方面:
~~~     电商网站的交易信息、物流信息、游览信息等
~~~     # 电信方面:
~~~     通话信息
~~~     # 总结:
~~~     HBase适合海量明细数据的存储,
~~~     并且后期需要有很好的查询性能(单表超千万、上亿,且并发要求高)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yanqi_vip

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值