1.简介:
Hbase是高可靠、高性能、面向列、可伸缩、实时读写的分布式数据库
利用HDFS作为其文件存储系统
,
利用mapreduce处理hbase中的海量数据
,
利用ZooKeeper作为分布式协同服务
主要用来
存储非结构化和半结构化的松散数据
2.概念介绍:
rowkey
决定一行数据,
按照字典顺序排序,只能存储64K字节数据
设计row key时,要充分利用这个排序特点,
将经常一起读取的数据存储到一块
,将最近可能会被访问的数据放在一块。
HBase中row key用来检索表中的记录,支持以下三种方式:
· 通过单个row key访问:即
按照某个row key键值进行get操作
;
· 通过row key的range进行scan:即
通过设置startRowKey和endRowKey,在这个范围内进行扫描
;
·
全表扫描
:即直接扫描整张表中所有行记录。