Hbase初识

最新推荐文章于 2024-05-30 11:02:47 发布

mizui_i

最新推荐文章于 2024-05-30 11:02:47 发布

阅读量312

点赞数

分类专栏： hadoop hbase 文章标签： hbase big data 数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mizui_i/article/details/121763221

版权

hadoop 同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

一.概述

1.产生原因

hadoop的mr/hdfs/hive等只能做数据的顺序访问,不能随机访问
很多场景需要数据的随机访问,例如身份证的识别,手机号的识别,健康码等

2.简述

全称 : hadoop habase
它是一个以hdfs为基础,面向列的分布式数据库,可以提供海量数据的随机实时读写
完全开源,参考了谷歌的bigtable数据库设计

3.应用场景

高并发,简单条件,随机查询
不擅长join类操作
半结构化,非结构化的数据存储
数据采集结果存储,海量数据查询等项目开发中经常使用

二.Hbase与hdfs的对比

相同点
- 都是面向大数据的存储系统
- hbase建立在hdfs之上
不同点
- hdfs顺序访问数据,hbase可以顺序访问,也可以随机访问
- hdfs吞吐量高,实时性差,hbase提供了亿级记录的低延时访问

三.重要概念

命名空间(namespace)
- 与关系型数据库的database类似
表(table)
- 类似关系型数据库中的表
行(row)
- 行由一个RowKey和多个列族组成，一个行有一个RowKey作为行的唯一标识。
列族(column family,CF)
- 多个列的集合,每行由多个列族组成
- 物理上,同一个列族的数据存储在一起
列限定符(column qualifier)
- 类似关系型数据库的列,由列名称和列族名称唯一限定
单元格(cell)
- 单元格由RowKey、列族、列限定符唯一定位，单元格之中存放一个值（Value）和一个版本号。
时间戳(timestamp)
- 即为版本号，来标识一个单元格的数据的最新的插入或是修改时间
- 单元格内不同版本的值按时间倒序排列，最新的数据排在最前面

四.核心设计

表是行的集合
行是列族的集合
列族是列的集合
列是键值对的集合

hbase表的样例

五.版本

2007年第一个可用的Hbase发布了
2010年5月成为Apache顶级项目
2014年2月 0.98发布该版本成为很多国内公司使用的最早版本
2015年10月 Hbase1.0发布
2017年5月 Hbase1.2.发布,这个作为了Hbase的稳定版本

版本变化说明:

hbase2.x相比于1.x主要是在架构设计优化、部分极端场景下的性能优化、可靠性、安全性得到进一步提升，修复众多Bug。
并没有发生底层本质性变化。
当前使用的是2.0.2版本

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Hbase初识

一.概述1.产生原因hadoop的mr/hdfs/hive等只能做数据的顺序访问,不能随机访问很多场景需要数据的随机访问,例如身份证的识别,手机号的识别,健康码等2.简述全称 : hadoop habase 它是一个以hdfs为基础,面向列的分布式数据库,可以提供海量数据的随机实时读写完全开源,参考了谷歌的bigtable数据库设计3.应用场景高并发,简单条件,随机查询不擅长join类操作半结构化,非结构化的数据存储数据采集结果存储,海量数据查询等项目开发中经常使用
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

mizui_i 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。