Hive与HBase之间的区别和联系

一、Hive概念

  1. Hive是hadoop数据仓库管理工具,不是数据库,本身是不存储数据和处理数据的,其依赖于HDFS存储数据,依赖于MapReducer进行数据处理。
  2. Hive的优点是学习成本低,可以通过类SQL语句(HSQL)快速实现简单的MR任务,不必开发专门的MR程序。
  3. 由于Hive是依赖于MapReducer处理数据的,有很高的延迟性。
  4. Hive的本质就是将结构化的数据文件映射为一张数据库表。

二、HBase概念

  1. HBase是一种分布式、可扩展、支持海量数据存储的NOSQL数据库
  2. HBase提供一个超大的内存hash表,支持随机读写,适用于海量数据的实时数据处理。

三、Hive与HBase的区别

特点HiveHBase
产品定位hadoop数据仓库管理工具分布式、可扩展、支持海量数据存储的NOSQL数据库
底层存储Hadoop-HDFSHadoop-HDFS
数据处理依赖于MapReducer处理数据提供一个超大的内存hash表,搜索引擎通过它来存储索引,方便查询操作
适用范围适用于离线数据的批处理适用于实时数据的处理
表单类型逻辑表物理表
写入操作不支持随机写操作支持随机写入操作
查询操作通过类SQL语句(HSQL)快速实现简单的MR任务HBase只支持简单的键查询,不支持复杂的条件查询

四、Hive和HBase的关系

在大数据架构中,Hive和HBase是协作关系,Hive是一种类SQL的引擎,并且运行MapReduce任务,Hbase是一种在Hadoop之上的NoSQL 的key-value数据库。Hive可以用来进行统计查询,HBase可以用来进行实时查询,数据也可以从Hive写到Hbase,设置再从Hbase写回Hive。

  • 4
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值