hbase 的介绍
nosql数据库,面向列式存储,内存存储机制,
存储的数据类型是二进制
hbase表
每行数据都有一个主键:rowky
一个表中,包含一个或者多个列簇(Column Family)CF
某个字段要属于某个列簇
一个列簇下面可以有百万个列
HBASE存储数据的本质,可以理解为键值对存储
key
rowkey+CF +column +timstamp
value
值是二进制方式储存
需要储存的值
hbase 数据库功能
存储类型是HDFS,为了数据存储的安全性
检索数据(也就是查询数据)
hbase体系
主存架构
主节点
hmaster 管理表
从节点
hregionServer数据存储,用户读取表中数据就是找regionServer
辅助框架zookeeper
存储habase相关配置信息和元数据
安装步骤
zookeeper
HDFS
hbase
hbase安装(伪分布式)
hbase官方文档
https://hbase.apache.org/book.html#quickstart
启动相关的进程
hadoop的主节点和存节点
sbin/hadoop-daemon.sh start namenode
sbin/hadoop-daemon.sh start datanode
上传解压
tar -zxvf xxxx -C ./
修改配置文件
hbase-env.sh
export JAVA_HOME=/opt/modules/jdk1.8.0_91
hbase-site.xml
<property>
<name>hbase.tmp.dir</name>
<value>/opt/cdh5.7.6/hbase-1.2.0-cdh5.7.6/data/tmpData</value>
</property>
<!--hbase相关数据存在哪里,hdfs的全路径-->
<property>
<name>hbase.rootdir</name>
<value>hdfs://bigdata-hpsk01.huadian.com:8020/hbase</value>
</property>
<!--是否是集群分布式,伪分布式也是分布式-->
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<!--如果是分布式部署,多个zookeeper节点,用逗号分隔-->
<property>
<name>hbase.zookeeper.quorum</name>
<value>bigdata-hpsk01.huadian.com</value>
</property>
启动hbase节点
主节点
bin/hbase-daemon.sh start master
从节点
bin/hbase-daemon.sh start regionserver
测试
一,jps
二,web ui
apache: 16010
cdh: 60010
hbase交互式命令
bin/hbase shell
简单测试
create创建表
list查看所有表
put插入数据