Hive
Hive是基于Hadoop之上的数据仓库,可以通过使用类SQL的语句HQL来查询存放在HDFS上的数据;HQL是中类SQL语言,这种语言最终被转化为Map/Reduce,但是hive不能用于交互式查询;适用于海量离线数据的全量查询分析;
Hive查询所花费的时间较长,不支持更新操作,
Hbase
nosql数据库之一,基于列式存储(列族),适合海量半结构化数据的存储和检索;
(半结构化数据有XML和JSON格式的数据)
HBase通过存储key/value来工作
运算执行引擎是hbase自身提供、底层存储基于hdfs
适用于大数据的实时查询
Hive和Hbase是两种基于Hadoop的不同技术–Hive是一种类SQL的引擎,并且运行MapReduce任务,Hbase是一种在Hadoop之上的NoSQL 的Key/vale数据库。当然,这两种工具是可以同时使用的。就像用Google来搜索,用FaceBook进行社交一样,Hive可以用来进行统计查询,HBase可以用来进行实时查询,数据也可以从Hive写到Hbase,设置再从Hbase写回Hive。