个人大数据总结之Hbase(一)-----安装及逻结构

本文是关于大数据领域中的HBase介绍,详细阐述了HBase的特性、逻辑结构(包括表、行键、列族和列限定符、单元格)和物理结构(涵盖HMaster、HRegionServer、HRegion等)。文章还提供了HBase的安装步骤,包括单机和分布式版本的安装流程。
摘要由CSDN通过智能技术生成

前言:

在大数据领域有一个非常著名的产品-hbase,其有别于传统的rdbms,被称之为列式数据库。那么什么是列式数据库呢?既然有列,那是不是也有行式数据库呢?

行式数据库:可以简单的理解为是传统的rdbms这些数据库,存放的是结构化的数据,非常有利于全表数据的扫描,但是相对来说,对于个别字段的扫描,就不那么方便了。

列式数据库:列式数据库是对行式数据库的一个改进,将部分列(或者说有关联的一些列)存放到单独的一个文件中,其他列存在其他多个文件中,我们在进行 查询的时候,只需要读取这些常用的列即可完成工作,这样减少了文件IO的读写,提高读写的效率(不用再像行式数据库那样进行全表的扫描,然后过滤相关字段)。

一、hbase简介

1.是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,

2.HBase利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,(利用zookeeper作为协调工具)。

3.特点

(1)hbase自身的特点

   ①高可靠性

   ②高性能

   ③面向列

   ④可伸缩

(2)hbase中表的特点

  ①可以纵向扩展

  ②可以横向扩展

二、hbase体系结构

1.逻辑结构(重点)

 ①表(table)

  划分数据集合的概念,和传统的db中的表的概念是一样的。

 ②行键(rowkey)

  一行数据的唯一标识,若想要操作hbase表中的一条数据,必须通过行键来定位,行键在hbase底层是使用字节数组进行存放的,所以方便我们使用rowkey来进行排序。

 一行数据的唯一标示,要想操作(read/write)一条数据,必须通过行健,其在hbase底层都是使用字节数组进行存放,所以方便我们使用rk进行排序,
        ③列族(columnFamily)

简单的认为是一系列“列”的集合,列族是以单独的文件来进行存储的。

④列限定符(column Qualifier)

 通常称之为列。列里边的数据定位通过列限定符,每个列族可以有一个或多个列成员(ColumnQualifier)。列成员不需要再定义表时规定,后期新加就可以了,可以动态注入。每个新加的列都会附带一个时间戳。在单元格中可以存放多个版本的数据。

 ⑤单元格(cell)

  cell由行键,列族:限定度,时间戳唯一决定的,cell中的数据时没有类

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值