大数据实战项目之新闻话题分析 学习笔记(七)——HBase的应用场景及架构原理

第8章:HBase的应用场景及架构原理
HBase能做什么
  • 海量数据存储
    • 海量存储与”关系型“数据库对比:海量-HBase一个表能够存储上百亿的行上百万的列;关系型数据库表里一般列设计不超过30个字段,行一般不超过5百万,否则要分表存储。
  • 准实时查询
    • 海量数据能够准实时查询得到。
  • HBase是针对海量数据,只有针对海量数据时才会发挥它的优势。如果只有上百万行的话,普通的关系型数据库就可以使用。
HBase在实际业务场景中的应用
  • 交通

    • 例如GPS信息、路口摄像头数据
  • 金融

    • 交易信息:取款、贷款信息……
  • 电商

    • 淘宝、京东……
  • 移动电话信息

    • 通话记录……
HBase的特点

1.容量大
在这里插入图片描述
2.面向列
在这里插入图片描述3.多版本
在这里插入图片描述4.稀疏性
在这里插入图片描述
在这里插入图片描述(左边:关系型数据库,确定了列数之后,每一行的数据相应列没有值必须赋空对象。
右边:列式存储。不需要确定列数,每一行数据需要多少列就存储多少列)

5.扩展性
底层依赖hdfs,磁盘不够的时候,可以直接添加datanode节点就好了。不需要像关系型数据库那样还要做数据迁移。

6.高可靠性
在这里插入图片描述高性能
在这里插入图片描述

HBase数据模型并举例说明

在这里插入图片描述举例:(面向列存储的表模型)
在这里插入图片描述
在这里插入图片描述
(在设计表的时候,不需要设计有几个列,因为列数是没有上线、动态增加的。只需要设计有多少”列簇“就好了)
在这里插入图片描述(一张表数据很多时,会划分为多个region。会自动切分、也可以人工干预。)
在这里插入图片描述(但是HBase不支持条件查询,只支持row-key查询。所以关系型数据库的优势就在于复杂的条件查询。)

HBase表结构模型并举例说明

HBase表结构设计
在这里插入图片描述设计只需要指定列簇。列根据数据情况动态增加
举例:
在这里插入图片描述


说明:
此系列文章为网课学习时所记录的笔记,希望给同为小白的学习者贡献一点帮助吧,如有理解错误之处,还请大佬指出。学习不就是不断纠错不断成长的过程嘛~

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值