HBase的学习以及安装

最新推荐文章于 2024-08-28 18:49:37 发布

2301_76934422

最新推荐文章于 2024-08-28 18:49:37 发布

阅读量719

点赞数 28

文章标签： hbase 学习数据库数据库架构

本文链接：https://blog.csdn.net/2301_76934422/article/details/140678294

版权

b. 配置hbase-site.xml文件

HBase数据库

Linux下软件的安装

HBase的安装也分为三种，单机版、伪分布版、分布版。

1.下载相关的包并解压

去官方网站下载好HBase的安装包，将压缩包放置到自己创建好的目录下面。

（这里是将HBase压缩包下载到了/opt目录下，然后将HBase解压到/app目录下）

mkdir /app #自己创建一个放置hbase软件的目录

cd /opt

tar -zxvf hbase-2.1.1-bin.tar.gz -C /app 将HBase解压到/app目录下

(语句解析：

tar：Linux系统下的归档工具，用于创建、维护和提取归档文件。
-zxvf：tar命令的选项，分别表示：
- z：通过gzip解压文件。
- x：从归档文件中提取文件。
- v：显示详细信息，即在解压过程中显示每个被解压的文件名。
- f：指定要处理的文件名。
hbase-2.1.1-bin.tar.gz：要解压的压缩文件名。
-C /app：将解压后的文件放到/app目录下。)

2. 配置相关的路径

a.配置JDK的路径

在HBase的conf目录下，输入echo $JAVA_HOME来复制JAVA_HOME的路径，以后面的配置：

这里我们要记着这个路径。

接着我们编辑HBase 的conf目录下的hbase-env.sh文件，将其中的JAVA_HOME指向到你Java的安装目录，最后保存设置：

export JAVA_HOME=你自己的JAVA_HOME的路径

b. 配置hbase-site.xml文件

hbase-site.xml文件，在<configuration>标签中添加如下内容：

<configuration>

<property>

<name>hbase.rootdir</name>

<value>file:///root/data/hbase/data</value>

</property>

<property>

<name>hbase.zookeeper.property.dataDir</name>

<value>/root/data/hbase/zookeeper</value>

</property>

<property>

<name>hbase.unsafe.stream.capability.enforce</name>

<value>false</value>

</property>

</configuration>

（对上述参数的解释：

hbase.rootdir：这个属性是设置HBase的根目录，即存储HBase数据的HDFS路径。在这个例子中，它被设置为file:///root/data/hbase/data。
hbase.zookeeper.property.dataDir：这个属性设置了ZooKeeper的数据目录，ZooKeeper是HBase用来管理集群状态和协调分布式操作的服务。在这个例子中，它被设置为/root/data/hbase/zookeeper。
hbase.unsafe.stream.capability.enforce：这个属性是一个布尔值，用于控制是否强制执行流能力检查。将其设置为false表示不强制执行流能力检查。这可能会导致性能下降或不稳定，但在某些情况下可能是必要的。

c.配置/etc/profile文件

配置好了之后我们就可以启动HBase了，在启动之前我们可以将Hbase的bin目录配置到/etc/profile中，这样更方便我们以后操作。

在etc/profile的文件末尾添加如下内容：

# SET HBASE_enviroment

HBASE_HOME=/app/hbase-2.1.1

export PATH=$PATH:$HBASE_HOME/bin

d.启动HBase

首先需要启动Hadoop，输入命令start-dfs.sh来启动Hadoop，输入jps查看是否启动成功，

接着我们输入start-hbase.sh来启动HBase，同样输入jps查看是否启动成功，出现了HMaster即表示启动成功了。

理论知识学习

HBase是一个基于Hadoop的分布式数据库，是 Google 的 Bigtable 开发的java版本。和传统的关系数据库不同，HBase采用了BigTable的数据模型。HBase提供了对大规模数据的随机、实时读写访问，同时，HBase中保存的数据可以使用MapReduce进行处理，他将对数据存储和并行计算完美结合在了一起。同时他也可以理解为一个非常大的分布式HashMap，在hadoop集群的各个节点中以行主键+列族（包含列）+时间戳为键，以储存的值为值。

1.架构

- HMaster：负责协调所有RegionServer的操作，如负载均衡和故障恢复。
- RegionServer：存储和管理数据的物理服务器，每个服务器可以有多个region。
- Region：HBase表被分割成多个Region，每个Region包含一个或多个列族的数据。
- Store：每个Region由多个Store组成，每个Store对应于一个列族。
- StoreFile：Store将数据存储在多个StoreFile中，这些文件是不可变的。

2.数据模型：

- 表由行键（Row Key）、列族（Column Family）和列限定符（Column Qualifier）组成。
- 数据通过行键进行排序，这决定了数据的物理布局，因此设计良好的行键对于查询性能至关重要。
- 每个单元格的数据有版本控制，支持时间戳。

3.数据操作：

- Put：向表中插入或更新数据。
- Get：从表中获取数据。
- Scan：返回表中的连续行范围。
- Delete：删除行或特定的单元格数据。
进入 HBase 客户端命令行。hbase shell
查看帮助命令。help
查看当前数据库中有哪些表。list
查看表结构，describe '表名'
创建表：create。如：我们新建一个名为test的表，使其中包含一个名为data的列，表和列族属性都为默认值，则可以使用如下命令：create ‘test’ , ‘data’
添加数据，使用put命令可以用来添加数据，使用get命令可以获取数据
查看所有数据，使用scan
删除整行数据：deleteall 表名，行名称即可删除正行数据。如：deleteall 'test','row1'
删除表，有两个步骤：disable 表名； drop 表名；