一、hbase集群安装部署(centos上)
在hadoop集群安装部署完成的前提下:
配置hbase-site.xml:
< configuration >
< property >
< name >hbase.master</ name > #hbase的主节点
< value >master.druid.hadoop</ value >
</ property >
< property >
< name >hbase.rootdir</ name > #将数据写入hdfs的目录
< value >hdfs://master.druid.hadoop:9000/hbase</ value >
</ property >
< property >
< name >hbase.cluster.distributed</ name > #设置hbase模式为集群模式
< value >true</ value >
</ property >
< property >
< name >hbase.zookeeper.property.clientPort</ name > #连接zookeeper的端口设置
< value >2181</ value >
</ property >
< property >
< name >hbase.zookeeper.quorum</ name > #设置zookeeper的连接地址(必须为基数个)
< value >master.druid.hadoop,slave1.druid.hadoop,slave2.druid.hadoop</ value >
</ property >
</ configuration >
|
配置完成之后,将 hbase-1.3.1/ 整个目录copy至其他节点。
启动hbase集群:bin/start-hbase.sh
停止hbase集群:bin/stop-hbase.sh
二、hbase常用操作
hbase是运行于HDFS顶层的NoSQL(=Not Only SQL,泛指非关系型的数据库)数据库系统。区别于Hive,HBase具备随即读写功能,是一种面向列的数据库。HBase以表的形式存储数据,表由行和列组成,列划分为若干个列簇(row family)。例如:一个消息列簇包含了发送者、接受者、发送日期、消息标题以及消息内容。每一对键值在HBase会被定义为一个Cell,其中,键由row-key(行键),列簇,列,时间戳构成。而在HBase中每一行代表由行键标识的键值映射组合。Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。