【HBase入门与实战】一文搞懂HBase!_hbase入门与实践

微服务和高并发:随着传统开发逐渐转向微服务架构,面向"老百姓"的应用需要处理的并发量急剧增加。在这种高并发环境下,传统关系型数据库在增删改查操作上的速度往往跟不上项目的需求。

传统开发解决高并发的策略:
在这里插入图片描述

  • ① 将数据库中的数据定期存储到Redis中,后端查询操作直接面向Redis来执行。
  • ② 构建数据库的Redis的集群化。

引入HBase的原因:当Redis的存储能力不足或主从结构过于复杂导致效率下降,Hbase成为一个优秀的选择。HBase以其【快速的读写速度】和【高吞吐量】,能够有效且快速地处理大数据的增删改查操作。

HBase特点:

  • ① 高吞吐量的读写操作
  • 为什么HBase有快速的读写速度(高吞吐量)?
  • 写操作:
  • 内存写入:所有的写操作首先被写入到MemStore中,这一操作是在内存中完成的,高效。并且对于HBase而言,只要数据写入MemStore存储区就标志着写操作已经完成,无需等待落盘。
  • 数据备份:在数据刷新到磁盘之前,所有的写操作都会被记录在Hlog,即使故障,也能够恢复数据。
  • 并行写操作:HBase的每个列族对应一个MemStore,能够对不同列族的数据进行并行处理。
    在这里插入图片描述
  • 如何理解"无需暂停写入操作以等待数据落盘"的设计理念?
  • MemStore提供了一种暂存数据的方式,直至数据被刷新到磁盘上的StoreFile中。
  • 通过WAL机制保证MemStore在数据未落盘时发生故障也不会导致数据丢失。
  • 保障数据一定能够落盘(即使数据丢失也可以通过HLog恢复数据),此时可以认为操作已经完成。
  • 因此写入的数据得到保障后,允许系统在高吞吐量的情况下继续接受和处理新的写请求。
  • 读操作:
  • 读操作可以直接从内存中的MemStore或者是缓存中的BlockCache获取数据
  • 使用Bloom Filter检查所需的数据是否不在StoreFile中,如果数据不在那里,能够及时终止读操作,避免了不必要的磁盘访问。
  • (为什么Bloom Filter能够实现快速检查的功能?BloomFilter的算法原理。)
  • ② HBase天生支持集群部署,无需进行复杂的分表或者分库操作。简化了大规模数据处理的复杂性。
  • ③ HBase是列式存储
  • 列式存储和行式存储的理解
  1. 定义
  • 列式存储是指每一列的数据存储在一起。
  • 行式存储是指每一行的数据存储在一起。
  1. 列式存储的优势
  • 高效的数据存储ÿ
  • 17
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值