Hive和Hbase是两种基于Hadoop的不同技术,
Hive是一种类SQL的引擎,并且运行MapReduce任务,hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。
Hbase是一种在Hadoop之上的NoSQL 的Key/vale数据库。
这两种工具是可以同时使用的。就像用Google来搜索,用FaceBook进行社交一样,Hive可以用来进行统计查询,HBase可以用来进行实时查询,数据也可以从Hive写到HBase,或者从HBase写回Hive。
注意:Hive适用于离线的数据分析和清洗,延迟较高,Hive是数据仓库的一种工具并不是数据仓库,而且Hsq最终转变成MapReduce运行程序(不要钻不需要执行MapReduce代码的情况的牛角尖).另外hive是基于Hadoop的工具,使用hive之前请确认已启动hadoop.
Hbase是一种面向列存储的nosql数据库,根据谷歌的一篇论文bigtable而实现的.数据持久化存储形式是Hfile,存放在HDFS的datanode中,被resionserver以region的形式进行管理.