前言
HBase on OSS
架构优势如下:
-
简化了数据迁移和恢复
HBase
的数据文件和表的元数据持久存储在集群外部的OSS
上,HBase
数据迁移和恢复时无需再使用快照等复杂的方式。
-
方便扩容
- 目前基于
Core Node
扩容HBase
计算时会同步扩容HDFS
,但是本文中的HDFS
集群本身只用于存储WAL(Write Ahead Log)
,需要的存储空间较少,所以实际是能够通过计算需求而非存储需求来调整EMR集群大小,同时OSS作为云存储服务,扩容操作也比较简单。
与其说是Hbase
替换现有底层存储hdfs
为oss
,不如说是hbase
替换底层存储hdfs
为oss-hdfs
。
环境准备:
- 目前基于
-
EMR 5.6.0
大数据集群(正常运行) -
oss
服务环境(正常运行)
组件hbase
oss
zookeeper
hdfs
操作步骤
具体的操作分为以下几个步骤:
- 联系主账号管理员,并确认
oss