Hive与HBase之间的区别和联系

一、Hive概念

  1. Hive是hadoop数据仓库管理工具,不是数据库,本身是不存储数据和处理数据的,其依赖于HDFS存储数据,依赖于MapReducer进行数据处理。
  2. Hive的优点是学习成本低,可以通过类SQL语句(HSQL)快速实现简单的MR任务,不必开发专门的MR程序。
  3. 由于Hive是依赖于MapReducer处理数据的,有很高的延迟性。
  4. Hive的本质就是将结构化的数据文件映射为一张数据库表。

二、HBase概念

  1. HBase是一种分布式、可扩展、支持海量数据存储的NOSQL数据库
  2. HBase提供一个超大的内存hash表,支持随机读写,适用于海量数据的实时数据处理。

三、Hive与HBase的区别

特点HiveHBase
产品定位hadoop数据仓库管理工具分布式、可扩展、支持海量数据存储的NOSQL数据库
底层存储Hadoop-HDFSHadoop-HDFS
数据处理依赖于MapReducer处理数据提供一个超大的内存hash表,搜索引擎通过它来存储索引,方便查询操作
适用范围适用于离线数据的批处理适用于实时数据的处理
表单类型逻辑表物理表
写入操作不支持随机写操作支持随机写入操作
查询操作通过类SQL语句(HSQL)快速实现简单的MR任务HBase只支持简单的键查询,不支持复杂的条件查询

四、Hive和HBase的关系

在大数据架构中,Hive和HBase是协作关系,Hive是一种类SQL的引擎,并且运行MapReduce任务,Hbase是一种在Hadoop之上的NoSQL 的key-value数据库。Hive可以用来进行统计查询,HBase可以用来进行实时查询,数据也可以从Hive写到Hbase,设置再从Hbase写回Hive。

  • 1
    点赞
  • 2
    收藏
  • 打赏
    打赏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
©️2022 CSDN 皮肤主题:创作都市 设计师:CSDN官方博客 返回首页
评论 3

打赏作者

H.S.T不想卷

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值