HBase 2.4.18 安装指南
一、HBase 核心原理
HBase 是分布式列式数据库,基于 Hadoop HDFS 存储数据,其架构和工作流程如下:
工作流程:
- 数据存储单元:表按 RowKey 水平分割为多个 Region,每个 Region 由 RegionServer 管理
- 写入流程:
- Client 连接 ZooKeeper 获取 RegionServer 位置
- 数据先写入 Write-Ahead-Log (WAL) 和 MemStore
- MemStore 满后刷写到 HDFS 生成 HFile
- 读取流程:
- 先查询 BlockCache(内存缓存)
- 未命中则合并查询 MemStore 和 HFile
- 故障恢复:
- RegionServer 宕机时,HMaster 通过 WAL 重放恢复数据
- HDFS 副本机制保障数据安全1**3
二、安装准备工作
# 验证Java环境
$ java -version # 输出:java version "1.8.0_212"
# 检查HDFS状态(需配置环境变量)
$ hdfs dfsadmin -report
# 环境变量配置(所有节点)
export HADOOP_HOME=/usr/local/hadoop-3.1.3
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin
三、安装与配置
- 创建安装目录:
$ sudo mkdir -p /opt/module/hbase
$ sudo chown atguigu:atguigu /opt/module/hbase
- 下载与解压:
$ cd /opt/software
$ wget https://archive.apache.org/dist/hbase/2.4.18/hbase-2.4.18-bin.tar.gz
$ tar -zxvf hbase-2.4.18-bin.tar.gz -C /opt/module/hbase
- 关键配置:
/opt/module/hbase-2.4.18/hbase-env.sh:
export JAVA_HOME=/opt/module/jdk1.8.0_212
export HBASE_MANAGES_ZK=true
export HBASE_DISABLE_HADOOP_CLASSPATH_LOOKUP="true" # 禁用自动类路径查找
▸ /opt/module/hbase-2.4.18/hbase-site.xml:
<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://192.168.10.102:9000/hbase</value> <!-- 主节点IP -->
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>192.168.10.103,192.168.10.104</value> <!-- ZK节点IP -->
</property>
</configuration>
▸ /opt/module/hbase-2.4.18/regionservers:
192.168.10.103 <!-- 从节点1 -->
192.168.10.104 <!-- 从节点2 -->
四、集群启动流程
启动顺序:
$ start-dfs.sh && start-yarn.sh # 先启动Hadoop
$ start-hbase.sh # 再启动HBase
五、故障排查要点
- 端口冲突:确保 16000, 16020, 16030 端口未被占用
- HDFS权限:
$ hdfs dfs -chmod 777 /hbase # 赋权HBase目录
- 类路径问题:当出现
ClassNotFoundException
时检查:
HBASE_DISABLE_HADOOP_CLASSPATH_LOOKUP
设置- Hadoop JAR 包是否在
$HBASE_HOME/lib
目录
六、安装验证表
验证项 | 检测命令 | 预期结果 |
---|---|---|
版本验证 | hbase version | HBase 2.4.18 |
存储状态 | hdfs dfs -ls /hbase | 显示WAL/HFile等目录 |
集群状态 | http://192.168.10.100:16010 | Web UI显示在线节点 |