Java进阶学习资料丨HBase特征简要

107 篇文章 2 订阅

一、 什么是HBase?

Apache HBase™是Hadoop数据库,一个分布式、可伸缩的大数据存储。当需要对大数据进行随机、实时的读写访问时,可选择使用Apache HBase™。该项目的目标是在普通硬件集群上托管非常大的表(数十亿行X数百万列)。Apache HBase是一种开源的、分布式的、版本化的、非关系数据库,它模仿了谷歌的Bigtable:一个用于结构化数据的分布式存储系统。正如Bigtable利用了谷歌文件系统提供的分布式数据存储一样,Apache HBase在Hadoop和HDFS之上提供了类似于Bigtable的功能。

 

二、HBase特征简要

自动故障处理和负载均衡

HBase运行在HDFS上,所以HBase中的数据以多副本形式存放,数据也服从分布式存放,数据的恢复也可以得到保障。另外,HMaster和RegionServer也是多副本的。

 

自动分区

HBase表是由分布在多个RegionServer中的region组成的,这些RegionServer又分布在不同的DataNode上,如果一个region增长到了一个阈值,为了负载均衡和减少IO,HBase可以自动或手动干预的将region切分为更小的region,也称之为subregion。

 

集成Hadoop/HDFS

虽然HBase也可以运行在其他的分布式文件系统之上,但是与HDFS结合非常之方便,而且HDFS也非常之流行。

 

实时随机大数据访问

HBase采用log-structured merge-tree作为内部数据存储架构,这种架构会周期性地将小文件合并成大文件以减少磁盘访问同时减少NameNode压力。

 

MapReduce

HBase内建支持MapReduce框架,更加方便快速,并行的处理数据。

 

Java API

HBase提供原声的Java API支持,方便开发。

 

横向扩展

HBase支持横向扩展,这就意味着如果现有服务器硬件性能出现瓶颈,不需要停掉现有集群提升硬件配置,而只需要在现有的正在运行的集群中添加新的机器节点即可,而且新的RegionServer一旦建立完毕,集群会开始重新调整。

 

列存储

HBase是面向列存储的,每个列都单独存储,所以在HBase中列是连续存储的,而行不是。

 

HBase Shell

HBase提供了交互式命令行工具可以进行创建表、添加数据、扫描数据、删除数据等操作和其他一些管理命令。

 

三、基于Hadoop的HBase架构

Java进阶学习资料丨HBase特征简要

 

HBase内置有zookeeper,但一般我们会有其他的Zookeeper集群来监管master和regionserver,Zookeeper通过选举,保证任何时候,集群中只有一个活跃的HMaster,HMaster与HRegionServer 启动时会向ZooKeeper注册,存储所有HRegion的寻址入口,实时监控HRegionserver的上线和下线信息。并实时通知给HMaster,存储HBase的schema和table元数据,默认情况下,HBase 管理ZooKeeper 实例,Zookeeper的引入使得HMaster不再是单点故障。一般情况下会启动两个HMaster,非Active的HMaster会定期的和Active HMaster通信以获取其最新状态,从而保证它是实时更新的,因而如果启动了多个HMaster反而增加了Active HMaster的负担。

 

一个RegionServer可以包含多个HRegion,每个RegionServer维护一个HLog,和多个HFiles以及其对应的MemStore。RegionServer运行于DataNode上,数量可以与DatNode数量一致,请参考如下架构图:

Java进阶学习资料丨HBase特征简要

如果你想在Java后端开发中进阶学习,以下是一些建议可以考虑: 1. 深入学习Java高级特性:掌握Java的高级特性,如多线程编程、并发编程、Lambda表达式、函数式编程等,可以提升你的编程能力和代码质量。 2. 学习Linux基础知识:Linux是大数据开发中常用的操作系统,了解Linux的基本命令和操作可以帮助你更好地进行开发和调试。 3. 掌握大数据技术栈:大数据开发需要掌握一系列的技术和工具,包括HadoopHBase、Hive、Kafka、Storm、Scala、Python、Spark等。逐步学习和实践这些技术,可以帮助你构建大数据应用和进行数据分析。 4. 学习机器学习算法:了解常用的机器学习算法,如分类、回归等,可以帮助你在大数据开发中进行数据挖掘和分析。 5. 实践项目经验:通过参与实际的项目开发,可以锻炼你的技术能力和解决问题的能力。可以尝试在实际项目中应用所学的技术和工具,积累项目经验。 总之,要进阶学习Java后端开发中的大数据方向,需要系统地学习和实践相关的技术和工具。不断提升自己的技术能力和项目经验,可以帮助你在大数据领域取得更好的发展。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* [Java面试题目,外包Java后端开发三年,算法太TM重要了](https://blog.csdn.net/m0_56662547/article/details/116647529)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [从 Java 后端开发,如何转到大数据开发(Hadoop/Kafka/Spark)?](https://blog.csdn.net/github_38592071/article/details/103826043)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值