Hbase 安装部署及常用操作

Hbase(实时分布式数据库): NoSql的数据库,像其他数据库一样提供随即读写功能 列式存储

链式的存储,结构化数据的可伸缩可扩展高性能面向链的数据库。非常大,快速查询,秒级别查询上亿,可进行实时查询HBase 是一个建立在 HDFS 之上,面向列的 NoSQL 数据库,用于快速读/写大量数据,HBase 使用 Zookeeper 进行管理。

HBase 是按列族进行数据存储的。每个列族会包括许多列,并且这些列是经常需要同时处理的属性。也就是说,HBase 把经常需要一起处理的列构成列族一起存放,从而避免了需要对这些列进行重构的操作。

Hadoop 是一个高容错、高延时的分布式文件系统和高并发的批处理系统,不适用于提供实时计算,而 HBase 是可以提供实时计算的分布式数据库,数据被保存在 HDFS (分布式文件系统)上,由 HDFS 保证其高容错性。

hbase 稀疏、多维度、有序的映射表。

http://c.biancheng.net/view/3586.html

Region 分区 replication 副本

HBase 的集群主要由 Master、Region Server 和 Zookeeper 组成,

hbase常见情况:

HBase的增、删、改、查操作。在添加数据时,HBase会自动为添加的数据添加一个时间戳,故在需要修改数据时,只需直接添加数据,HBase即会生成一个新的版本,从而完成“改”操作,旧的版本依旧保留,系统会定时回收垃圾数据,只留下最新的几个版本,保存的版本数可以在创建表的时候指

hbase参考指南(官网): https://hbase.apache.org/book.html#standalone_dist

学习参考路线: https://www.cnblogs.com/qingyunzong/p/8668880.html#_label3_0

​ http://dblab.xmu.edu.cn/blog/2442-2/

Hbase 安装部署及常用操作

1.hbase下载并上传hbase-2.4.4-bin.tar.gz至soft文件夹,解压。

 https://www.apache.org/dyn/closer.lua/hbase/2.4.4/hbase-2.4.4-bin.tar.gz 
 tar -zxvf hbase-2.4.4-bin.tar.gz

进入cd /soft/hbase-2.4.4 目录查看hbase的版本信息

./bin/hbase version   

或 vi  /etc/profile  
添加环境变量 
export PATH=$PATH:/soft/hbase-2.4.4/bin  
刷新环境变量
source  /etc/profile

2.修改配置文件hbase-env.sh

#配置jdk环境
export JAVA_HOME=/soft/jdk1.8.0_181
#配置使用自带的ZooKeeper
export HBASE_MANAGES_ZK=true

3.修改配置文件

 <property>
    <name>hbase.cluster.distributed</name>
    <value>false</value>
  </property>
 <!-- 启动HBase前需要设置属性hbase.rootdir,用于指定HBase数据的存储位置,因为如果不设置的话,hbase.rootdir默认为/tmp/hbase-${user.name},这意味着每次重启系统都会丢失数据-->
  <property>
    <name>hbase.rootdir</name>
    <value>file:///root/hbase</value>
  </property>
  <property>
    <name>hbase.tmp.dir</name>
    <value>./tmp</value>
  </property>
  <!-- 指定 hbase 是分布式的 true -->
  <property>
    <name>hbase.unsafe.stream.capability.enforce</name>
    <value>false</value>
  </property>

4.启动/停止hbase, 启动hbase后输入jps,显示HMaster,则成功。

./start-hbase.sh 
./stop-hbase.sh

启动Hadoop—>启动HBase—>关闭HBase—>关闭Hadoop

5.进入hbase的shell命令

hbase shell
#创建表
create 'student','Sname','Ssex','Sage','Sdept','course'

查看表信息
describe 'student'

添加数据(HBase中用put命令添加数据,注意:一次只能为一个表的一行数据的一个列,也就是一个单元格添加一个数据,所以直接用shell命令插入数据效率很低,在实际应用中,一般都是利用编程操作数据)
put 'student','95001','Sname','LiYing'

删除数据 
删除delete
删除所有deleteall
delete 'student','95001','Ssex'
删除表 (第一步先让该表不可用,第二步删除表)
disable 'student'  
drop 'student'

查询数据
get 'student','95001' --查看表的某一行数据
scan 'student'   --查看所有

退出hbase shell
exit
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Hadoop、Zookeeper、HBase和Docker都是大数据领域中常用的技术工具。 Hadoop是一个分布式计算框架,它可以将大数据分散到多个计算机集群上进行处理和存储。Hadoop的主要组件包括HDFS(分布式文件系统)和MapReduce(分布式计算模型),通过这两个组件,Hadoop可以实现对大规模数据的分布式处理和分布式存储。 Zookeeper是一个开源的分布式协调服务,它可以用于在分布式系统中管理和协调各个节点之间的状态和配置信息。Zookeeper提供了高可用性、一致性以及可靠性的特性,可以用于处理分布式应用程序中的诸多问题,比如选举机制、配置管理、命名服务等。 HBase是建立在Hadoop之上的分布式列式数据库,它提供了高度可扩展、高性能和高可靠性的存储和访问大规模结构化数据的能力。HBase基于Hadoop HDFS存储数据,同时将数据按照列族存储,具有快速随机读写的特性,适合处理海量数据。 Docker是一种容器化平台,它可以在操作系统层面上实现虚拟化,将应用程序及其依赖项打包成一个独立的容器,从而实现跨平台、快速部署和可移植性。在使用Docker时,可以将Hadoop、Zookeeper和HBase等组件打包成容器,方便在不同环境中进行部署和管理。同时,Docker还提供了简单易用的容器管理工具,可以进行容器的快速启动、停止和扩展。 综上所述,Hadoop、Zookeeper、HBase和Docker都是大数据领域中常用的技术工具。Hadoop用于分布式计算和存储,Zookeeper用于分布式协调和管理,HBase用于大规模结构化数据的存储和访问,而Docker则提供了容器化平台,方便部署和管理这些大数据技术组件。这些工具的使用可以帮助提高大数据处理的性能、可靠性和可扩展性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

superlliuchao

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值