Hbase学习（一）零基础开始学习

最新推荐文章于 2024-08-18 14:13:01 发布

_小太阳_

最新推荐文章于 2024-08-18 14:13:01 发布

阅读量2.4k

点赞数 1

分类专栏： hbase learning 文章标签： hbase structure

本文链接：https://blog.csdn.net/qq_40504899/article/details/81744840

版权

hbase learning 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

hbase是谷歌bigdata论文的一个代码实现，hbase是开源软件，在大数据处理领域应用广泛。今天楼主先来介绍一些基本原理，后面用工程代码方式来叙述API的用法。楼主是新手，如有错误，欢迎大家指正。

简介

Hbase（Hadoop database）是一个高可靠性（数据存储在HDFS文件存储系统上，十分可靠，有机会楼主再写HDFS的博文）、高性能（传统单机数据库在数据量高于百万数量级后性能很差）、面向列、可伸缩实时读写的分布式数据库。
hbase主要用来存储非结构化和半结构化的松散数据。

数据结构

首先介绍一下基本概念

row key

决定一行数据；按照字典顺序排序，数据有结构；row key最大为64K（注意只能存储字节数组，要先转换成字节数组才能存入hbase）

time stamp 时间戳

hbase每个cell存储单元对同一份数据由多个版本，根据时间戳来区分不同版本，不同版本的数据按照时间倒序排列，最新的数据排在最前面。时间戳是64为整形数据，在写入数据时自动赋值（用户也可以自己给时间戳赋值）。hbase并不会存储每个时间戳的历史数据，由用户设置一个最大版本数来约束版本的数量，多余的版本在合并时被删除。