什么是HBase(HBase的初步引入)

前言: HBase主要起源于谷歌的三驾马车论文之一BigTable中,是建立在HDFS上的高可靠性、高性能、列存储、可伸缩、实时读写NoSQL的数据库系统.

1. 为什么会出现HBase

1.1 HBase开篇

要想理解为什么会出现HBase,首先要和其他的大数据组件进行一个对比.

1.1.1 HBase与Hadoop的对比(HDFS的对比)
Hadoop特点或缺点:
	 缺点:Hadoop适用于一次写入多次读取的场景,但是对于大量数据的实时查询,无法适应或不支持
	 引入Hbase:面相列存储,上十亿行,百万列
1.1.2 Hbase和RDBMS关系型数据库对比
1)关系型数据库支持事物丶join等的操作
2)HBase仅支持单行的事物,不支持join操作
3)HBase面向列存储,对于为null的数据不占用空间,可以理解为稀疏表或者稀疏矩阵

在这里插入图片描述

1.1.3 HBase与Hive
1)Hive主要为数仓工具,在数仓中提供类似SQL的语法对数据进行清洗丶转换.Hive
将元数据存储在MySQL,真实数据存储在HDFS,基于MR做计算,主要用于离线统计分析.
2)Hbase,将数据存储在DataNode(HDFS)上,但是基于Hbase做实时数据查询的功能.

所以: HBase(Hadoop DataBase)的出现解决了Hadoop在实时领域的不足之处.

2. HBase的应用场景

2.1 HBase的基石
  • 1: 基于HDFS实现数据的存储
  • 2: 基于MR实现大数量量的计算或查询
  • 3: 基于ZK实现状态处理(所以启动HBase前要先启动HDFS和zookpeer)
2.2 应用场景
  • 对象存储:
	不少的头条类、新闻类的的新闻、网页、图片存储在HBase之中,一些病毒公司的病毒库也是存储在HBase之中.
  • 时序存储
HBase之上有OpenTSDB模块,可以满足时序类场景的需求
  • 推荐画像
用户画像,是一个比较大的稀疏矩阵,蚂蚁金服的风控就是构建在HBase之上
  • 时空数据
主要是轨迹、气象网格之类,滴滴打车的轨迹数据主要存在HBase之中,另外在技术
所有大一点的数据量的车联网企业,数据都是存在HBase之中
  • 消息/订单
在电信领域、银行领域,不少的订单查询底层的存储,另外不少通信、消息同步的应用构建在HBase之上
  • Feeds流
朋友圈类似的应用,用户可以随时发布新内容,评论、点赞。
  • NewSQL
有Phoenix的插件,可以满足二级索引、SQL的需求,对接传统数据需要SQL非事务的需求
  • 其他
存储爬虫数据
海量数据备份
短网址
…..
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值