深入浅出了解HBase及RDD编程

本文深入介绍了HBase的架构和数据模型,包括行键、列族、列限定符和时间戳的概念。阐述了HBase如何利用时间戳实现数据版本控制,并解释了其能存储海量数据的原因。此外,还详细展示了如何创建HBase表以及如何配置Spark与HBase进行数据读写操作。
摘要由CSDN通过智能技术生成


关于搭建HBase高可用集群的图文教程,可参考我的另一篇博文—— 安装并配置HBase集群(5个节点)

HBase简介

HBase是Google BigTable的开源实现,Google公司很多数据如搜索、相册、导航数据都保存在BigTable中,2003年Google发布了该技术后,社区实现了HBase。

架构

在这里插入图片描述
在这里插入图片描述

HBase在Hadoop中扮演者数据库的角色,但HBase要借助底层的HDFS来存储数据,自身并没有实现文件系统,或者说HBase有点像mysql一样,支持热插拔的文件系统(HBase既支持HDFS,也支持本地文件系统,就像Mysql支持InnoDB、MyISM等等)。而上图中包围着HBase的就是计算框架(MapReduce和Spark),并且MapReduce正逐步被Spark所替代。

HBase是什么样的数据库?关键是数据模型

HBase是一个稀疏、多维度、排序的映射表。

关键要素:
  • 行键
  • 列族
  • 列限定符
  • 时间戳

在这里插入图片描述
在Mysql中,我们操作的是一行行的数据;而在HBase中,我们操作(写数据、读数据)的是单元格

什么是单元格

通过行、列族、列限定符确定的是一个单元格。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值