分布式数据库Hbase探究
文章平均质量分 94
分布式数据库Hbase探究
缘友一世
我是缘友一世博主,热爱技术、热衷于分享。我的博客专注于计算机科学和软件开发领域的学习和实践经验。在博客中,你可以找到各种编程语言的深入解析和实用技巧。我致力帮助读者更好地理解和应用技术。同时,我也关注技术行业的发展趋势和前沿研究。感谢您的关注和支持!部分文章内容辅助使用gpt等人工智能编辑,如果出现错误之处,请指正
展开
-
HBase(docker版)简单部署和HBase shell操作实践
create:创建表# 创建表 t1,列族为 f1,列族版本号为 5# 创建表 t2,3 个列族分别为 f1、f2、f3# 等价的命令# 创建表 t3,将表依据分割算法 HexStringSplit 分布在 15 个 Region 里# 创建表 t1,指定切分点list:列出表信息hbase(main):035:0> listTABLEt11 row(s)=> ["t1"]alter:修改列族模式# 向表t2添加列族 f1Done.# 删除表t2中的列族 f1Done.原创 2024-01-30 23:00:46 · 1789 阅读 · 1 评论 -
HBase入门:运行机制
这种方式的缺点:如果一个 Region 服务器发生故障,为恢复其上的Region 对象,需要将 Region 服务器上的 HLog 按照其所属的 Region 对象进行拆分,然后分发到其他 Region 服务器上执行恢复操作。系统根据每条日志记录所属的 Region 对象对 HLog 数据进行拆分,分别放到相应 Region 对象的目录下,然后将失效的 Region 重新分配到可用的 Region 服务器中,并把与该 Region 对象相关的HLog 日志记录也发送给相应的 Region 服务器。原创 2024-01-27 23:08:11 · 1342 阅读 · 0 评论 -
HBase入门:实现原理
注意:随着 HBase 中表的不断更新,Region 的位置信息可能会发生变化,但是客户端缓存并不会本地检测 Region 位置信息是否失效,而是在需要访问数据时,从缓存中获取 Region 位置信息发现不存在时,才会判断出缓存失效。该过程需要多次网络操作,为加速寻址过程,一般会在客户端把查询过的位置信息缓存起来,访问相同的数据时,直接从客户端缓存中获取 Region 的位置信息,不需要每次都经历一个“三级寻址”过程。初始时,每个表只包含一个 Region,随着数据的不断插入,Region 会持续增大。原创 2024-01-26 19:08:08 · 1341 阅读 · 0 评论 -
Hbas简介:数据模型和概念、物理视图
HBase 是谷歌 BigTable 的开源实现,是一个高可靠、高性能、面向列、可伸缩的分布式非关系型数据库,主要用来存储非结构化和半结构化的松散数据,并提供高吞吐量和低延迟的数据访问能力。HBase的架构是基于Hadoop生态系统的,它使用HDFS作为底层存储系统;并利用 Hadoop MapReduce来处理 HBase 中的海量数据,实现高性能计算;利用 ZooKeeper 作为协同服务,实现稳定服务和失败恢复。原创 2024-01-23 22:30:09 · 1482 阅读 · 0 评论