【HBase入门与实战】一文搞懂HBase!_hbase入门与实践

最新推荐文章于 2024-05-28 22:54:24 发布

2401_84181125

最新推荐文章于 2024-05-28 22:54:24 发布

阅读量1.2k

点赞数 17

分类专栏： 2024年程序员学习文章标签： hbase 数据库大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84181125/article/details/137497953

版权

微服务和高并发：随着传统开发逐渐转向微服务架构，面向"老百姓"的应用需要处理的并发量急剧增加。在这种高并发环境下，传统关系型数据库在增删改查操作上的速度往往跟不上项目的需求。

传统开发解决高并发的策略：
在这里插入图片描述

① 将数据库中的数据定期存储到Redis中，后端查询操作直接面向Redis来执行。
② 构建数据库的Redis的集群化。

引入HBase的原因：当Redis的存储能力不足或主从结构过于复杂导致效率下降，Hbase成为一个优秀的选择。HBase以其【快速的读写速度】和【高吞吐量】，能够有效且快速地处理大数据的增删改查操作。

HBase特点：

① 高吞吐量的读写操作

为什么HBase有快速的读写速度(高吞吐量)？
写操作：

内存写入：所有的写操作首先被写入到MemStore中，这一操作是在内存中完成的，高效。并且对于HBase而言，只要数据写入MemStore存储区就标志着写操作已经完成，无需等待落盘。
数据备份：在数据刷新到磁盘之前，所有的写操作都会被记录在Hlog，即使故障，也能够恢复数据。
并行写操作：HBase的每个列族对应一个MemStore，能够对不同列族的数据进行并行处理。

如何理解"无需暂停写入操作以等待数据落盘"的设计理念？

MemStore提供了一种暂存数据的方式，直至数据被刷新到磁盘上的StoreFile中。
通过WAL机制保证MemStore在数据未落盘时发生故障也不会导致数据丢失。
保障数据一定能够落盘(即使数据丢失也可以通过HLog恢复数据)，此时可以认为操作已经完成。
因此写入的数据得到保障后，允许系统在高吞吐量的情况下继续接受和处理新的写请求。

读操作：

读操作可以直接从内存中的MemStore或者是缓存中的BlockCache获取数据
使用Bloom Filter检查所需的数据是否不在StoreFile中，如果数据不在那里，能够及时终止读操作，避免了不必要的磁盘访问。
(为什么Bloom Filter能够实现快速检查的功能？BloomFilter的算法原理。)

② HBase天生支持集群部署，无需进行复杂的分表或者分库操作。简化了大规模数据处理的复杂性。
③ HBase是列式存储

列式存储和行式存储的理解

定义

列式存储是指每一列的数据存储在一起。
行式存储是指每一行的数据存储在一起。

列式存储的优势

高效的数据存储ÿ

最低0.47元/天解锁文章

关注

17
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
【HBase入门与实战】一文搞懂HBase!_hbase入门与实践

定义是一个面向列存储的NoSQL数据库是一个分布式HashMap，底层数据是Key-Value格式使用HDFS作为存储并利用其可靠性什么是【分布式HashMap】？HashMap的本质是用一个简单的值形式映射一个复杂的值形式。HBase通过一个RowKey提取该RowKey下多个列族下多个列的多个值。特点数据访问速度快，响应时间约2~20ms。实时数仓和离线数仓都会用到HBase：实时数仓响应速度快离线数仓宽表列存储。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。