2024年最全【Hadoop】Hbase 面向列的Nosql 、分布式数据库(1),2024年最新分析软件测试未来几年的发展前景

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

Hbase是面向列存储的、非结构型、分布式数据库。

架构图

Region:服务器:

Region是hbase中分布式存储和负载均衡的最小单位,一个表拥有多个region,分配在不同的region服务器上,一个region内的数据存储在一个region服务器上。物理上所有的数据存储到hdfs上。

一台计算机上只运行一个region服务器,管理维护其他region实例。

Hbase在行的方向上将存储表分成了多个region。每个表最初只有一个region,随着记录数的增加,region会被分割成两个新的region,以此类往。通常一段时间后,一个表中会有n 个 region。

Region由一到多个store组成,每个store保存一个列族的所有数据。每个store由一个memstore和零个或多个storefile组成。

Storefile则Hfile的格式存储在HDFS中。

主服务器:

Hbase是主从结构。每个时刻只有一个HMaster运行,HMaster将Region分配给Region服务器,协调region服务器的负载并维护集群状态。

HMaster只向Region服务器提供数据服务,Region服务器负责对所有region的读写请求操作。HMaster通过ZooKeeper判断是否出现故障,如出现则会参考log文件,重新分配Regions。

元数据表:

用户表的regions元数据被存储在.meta表中,随着region的增加,.meta表中数据也会增大,并分裂成多个regions。.meta将表中的多个regions的元数据保存在ROOT表中,由ZooKeeper记录ROOT表的位置信息以便查询。

中ROOT表不会被分割,只有一个region,用以保障最多需要三次跳转就可以定位到任意一个region.

运行原理

数据库发展

1.nosql

NoSQL(NoSQL = Not Only SQL ),意即“不仅仅是SQL”,NoSQL数据库是非关系的、水平可扩展、分布式并且是开源的。在当时是一项全新的数据库革命性运动,NoSQL数据库主要分为四大类:健值存储数据库、列存储数据库、文档型数据库、图形数据库。

NoSQL 数据库分类

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

rums/4f45ff00ff254613a03fab5e56a57acb)**

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 8
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值