大数据从入门到实战 - HBase 伪分布式环境搭建


叮嘟!这里是小啊呜的学习课程资料整理。好记性不如烂笔头,今天也是努力进步的一天。一起加油进阶吧!
在这里插入图片描述

一、关于此次实践

1、实战简介

通过学习单机版HBase安装与hbase shell常用操作之后,我们就可以来开始配置HBase的伪分布式环境以及完全分布式环境了,伪分布式意味着HBase仍然在单个主机上完全运行,但是每个HBase守护程序(HMaster,HRegionServer和Zookeeper)作为单独的进程运行,在独立模式下,所有守护进程都在一个jvm进程/实例中运行。默认情况下,你的数据仍然存放在本地目录下,在本次实训中,我们将会将数据存储在HDFS中。

在这里插入图片描述

2、全部任务

在这里插入图片描述

二、实践详解

1、第1关:伪分布式环境搭建

任务描述

本关任务:安装伪分布式HBase。

相关知识

上次实训中我们已经完成了单机版HBase的安装,单机版意味着我们的HBase数据仍然是存放在本地,而没有存放在Hadoop集群中,本关我们来学习如何配置一个伪分布式的HBase环境,伪分布式意味着HBase仍然在单个主机上运行,但每个HBase的守护程序(HMaster、HRegionServer和Zookeeper)作为单独的进程运行;在伪分布式的环境下,我们会将HBase的数据存储在HDFS中,而不是存放在本地了,接下来我们就来一起搭建环境吧。

实验环境:

hadoop2.7;
JDK8;
HBase2.1.1;
hadoop已安装;
JDK已安装,环境变量已配置;
HBase压缩包已下载,存放在/opt目录下。

在搭建环境之前我们首先来了解一下HBase分布式环境的整体架构:
在这里插入图片描述

我们来简单认识一下与HBase的相关组件:

Zookeeper:
Zookeeper能为HBase提供协同服务,是HBase的一个重要组件,Zookeeper能实时的监控HBase的健康状态,并作出相应处理。

HMaster:
HMaster是HBase的主服务,他负责监控集群中所有的HRegionServer,并对表和Region进行管理操作,比如创建表,修改表,移除表等等。

HRegion:
HRegion是对表进行划分的基本单元,一个表在刚刚创建时只有一个Region,但是随着记录的增加,表会变得越来越大,HRegionServer会实时跟踪Region的大小,当Region增大到某个值时,就会进行切割(split)操作,由一个Region切分成两个Region。

HRegionServer:
HRegionServer是RegionServer的实例,它负责服务和管理多个HRegion 实例,并直接响应用户的读写请求。

总的来说,要部署一个分布式的HBase数据库,需要各个组件的协作,HBase通过Zookeeper进行分布式应用管理,Zookeeper相当于管理员,HBase将数据存储在HDFS(分布式文件系统)中,通过HDFS存储数据,所以我们搭建分布式的HBase数据库的整体思路也在这里,即将各个服务进行整合。

接下来,我们就一起来搭建一个伪分布式的HBase。

配置与启动伪分布式HBase
如果你已经完成了单节点HBase的安装,那伪分布式的配置对你来说应该很简单了,只需要修改hbase-site.xml文件即可:

vim /app/hbase-2.1.1/conf/hbase-site.xml

在这里主要有两项配置:

1.开启HBase的分布式运行模式,配置hbase.cluster.distributed为true代表开启HBase的分布式运行模式:

<property>
  <name>hbase.cluster.distributed</name>
  <value>true</value>
</property>

2.是设置HBase的数据文件存储位置为HDFS的/hbase目录,要注意的是在这里我们不需要在HDFS中手动创建hbase目录,因为HBase会帮我们自动创建。

<property>
  <name>hbase.rootdir</name>
  <value>hdfs://localhost:9000/hbase</value>
</property>

修改之后hbase-site.xml<configuration>代码:

在这里插入图片描述

标红部分为我们需要注意的配置。我们在设置单节点的时候将hbase.unsafe.stream.capability.enforce属性值设置为了false,在这里我们需要注意设置它的值为true,或者干脆删除这个属性也是可以的。

配置完成之后,我们需要先启动Hadoop,然后启动HBase,最后输入jps查看启动的进程:
在这里插入图片描述

如果出现HMaster和HRegionServer以及HQuorumPeer三个服务则代表伪分布式环境已经搭建成功了。

在HDFS中验证
接下来我们进一步验证:在HDFS中检查HBase文件。

如果一切正常,HBase会在HDFS中自动建立自己的文件,在上述配置文件中,设置的文件位置为/hbase,我们输入hadoop fs -ls /hbase即可查看,如下图所示,分布式文件系统(HDFS)中hbase文件夹已经创建了:

在这里插入图片描述

测评
在这里插入图片描述

Ending!
更多课程知识学习记录随后再来吧!

就酱,嘎啦!

在这里插入图片描述

注:
人生在勤,不索何获。

  • 1
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 5
    评论
HBase 作为一种基于 Hadoop分布式数据库,它的分布式环境搭建也是基于 Hadoop分布式环境搭建的基础上进行的。下面是 HBase 分布式环境搭建的步骤: 1. 安装和配置 Hadoop Hadoop安装和配置可以参考 Hadoop 官方网站的文档。 2. 安装和配置 HBase 下载 HBase 安装包并解压缩,将解压后的文件夹移动到某个目录下,比如 /usr/local/hbase。 修改 HBase 配置文件 conf/hbase-site.xml,添加如下配置: ```xml <configuration> <property> <name>hbase.rootdir</name> <value>hdfs://localhost:9000/hbase</value> </property> <property> <name>hbase.zookeeper.property.dataDir</name> <value>/usr/local/hbase/zookeeper</value> </property> </configuration> ``` 其hbase.rootdir 是 HBase 存储数据的根目录,需要指定 HDFS 的地址;hbase.zookeeper.property.dataDir 是 ZooKeeper 存储数据的目录。 3. 启动 Hadoop 和 ZooKeeper 启动 Hadoop 和 ZooKeeper 服务: ```bash $ start-dfs.sh $ start-yarn.sh $ zkServer.sh start ``` 4. 启动 HBase 启动 HBase 服务: ```bash $ cd /usr/local/hbase $ ./bin/start-hbase.sh ``` 启动后,可以通过浏览器访问 http://localhost:16010/ 查看 HBase 的 Web 界面。 5. 使用 HBase 使用 HBase 可以通过命令行工具 hbase shell 或者编写 Java 应用程序来进行。以下是使用 hbase shell 的简单示例: ```bash $ hbase shell > create 'mytable', 'cf' > list > put 'mytable', 'row1', 'cf:col1', 'value1' > get 'mytable', 'row1' > scan 'mytable' > disable 'mytable' > drop 'mytable' > exit ``` 以上命令创建一个名为 mytable 的表,添加一条数据,查询数据,扫描整个表,禁用表和删除表。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

发芽ing的小啊呜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值