1、HBase简介
1、HBase – Hadoop Database,是一个高可靠、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化的存储集群。
2、HBase利用HDFS作为其文件存储系统,利用 MapReduce来处理HBase中的海量数据,利用Zookeeper作为协调工具。
高可靠:指的是HBase非常稳定
高性能:指的是可以存储上亿或者十亿级别的数据,可以实现毫秒级别查询
面向列:这个指的是数据的存储方式,按照列存储
可伸缩:表示可以很方便的添加或者删除一个节点
3、Hbase是一个分布式的开源NoSQL数据库(key-value类型),基于Hadoop的分布式文件系统(HDFS)
4、HBase只关注于查询,HDFS负责做数据存储
5、HBase模仿提供了Google文件系统BigTable数据库的所有功能
6、HBase可以处理非常庞大的表,适合处理1亿条或者10亿条以上记录或者有百万个列的数据
2、安装与配置
2.1.上传包 hbase-1.2.6-bin.tar.gz
2.2.解压 tar -zxvf hbase-1.2.6-bin.tar.gz
2.3.修改配置
hbase-env.sh
export JAVA_HOME=/opt/jdk/jdk1.8.0_45
export HBASE_MANAGES_ZK=false
export HBASE_LOG_DIR=/opt/hbase/logs
hbase-site.xml
<configuration>
<property >
<name>hbase.rootdir</name>
<value>hdfs://hadoop01:9000/hbase</value>
</property>
<property>
<name>hbase.tmp.dir</name>
<value>/opt/hbase/tmp</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<!-- 如果是zk集群的话,多个节点之间用逗号隔开,例如:hadoop100,hadoop101,hadoop102 -->
<property>
<name>hbase.zookeeper.quorum</name>
<value>hadoop01,hadoop02,hadoop03</value>
</property>
</configuration>
查看hdfs://hadoop01:9000/hbase下有没有数据
hdfs dfs -ls hdfs://hadoop01:9000/hbase
删除hdfs://hadoop01:9000/hbase下的数据
hdfs dfs rm -r hdfs://hadoop01:9000/hbase
backup-masters
vim backup-masters
hadoop01 # 主节点
regionservers
vim regionservers
hadoop02 # 从节点
hadoop03
注意:HBase配置修改完毕以后,一定记得要把修改后的安装包拷贝到所有从节点
在hadoop01上执行下面两个命令
scp -rq hbase hadoop02:/opt
scp -rq hbase hadoop03:/opt
3、启动基本的依赖环境
a.保证hadoop是正常运行的
b.保证zookeeper是正常运行的
zookeeper的启动
启动
bin/zkServer.sh start
注意:想要停止的话使用bin/zkServer.sh stop
4、启动
在hadoop01上执行启动命令
cd hbase
bin/start-hbase.sh
5、启动完成可以在浏览器上打开链接
http://hadoop01:16010