Hive与HBase的区别及应用场景

最新推荐文章于 2024-01-22 19:12:13 发布

6个日的梦想

最新推荐文章于 2024-01-22 19:12:13 发布

阅读量2.8k

点赞数 4

分类专栏：大数据学习整理文章标签： hive hbase hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wu6cfp38/article/details/129345143

版权

大数据学习整理专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Hive是基于Hadoop的数据仓库工具，简化了对海量数据的SQL查询，适合离线分析；而HBase是一个分布式NoSql数据库，提供快速的实时查询，适用于大数据量的即时访问。两者在数据存储、处理方式和应用场景上具有显著差异。

摘要由CSDN通过智能技术生成

当数据量达到一定量级的时候，存储和统计计算查询都会遇到问题，今天了解一下Hive和Hbase的区别和应用场景。

一、定义

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，默认情况下可以将sql语句转换为MapReduce任务进行运行。

HBase是Hadoop的数据库，一个分布式、可扩展、大数据的存储。

二、区别

Hive是运行在Hadoop上的一个工具，准确地讲是一个搜索工具。当对海量数据进行搜索时，Hadoop的计算引擎是MapReduce。但是对MapReduce的操作和编程是非常复杂的。于是Hive的存在就让复杂的编程过程简化成了用SQL语言对海量数据的操作。这大大减轻了程序员的工作量。

HiveSql默认情况下会转换成MapReduce进行计算，所以比较慢，只能做离线数据分析，不能做实时查询。

HBase，它是Hadoop的子项目，当然也可以理解为一个工具。Hadoop的数据运算是由MapReduce完成的，而数据存储是由HDFS完成的。HDFS是分布式存储，这是Hadoop存储数据的特点，但由此带来的问题就是数据的无序和散乱。

HBase是NoSql数据库，是物理表，不是逻辑表，虽然数据是存储在hdfs，但是读写速度非常快，适合做大数据量的即时查询。

三、应用场景

1.Hive中的表为纯逻辑表，仅仅对表的元数据进行定义。Hive没有物理存储的功能，它完全依赖HDFS和MapReduce。HBase表则是物理表，适合存放非结构化的数据。

2.Hive是在MapReduce的基础上对数据进行处理，而MapReduce的数据处理依照行模式；而HBase为列模式，这样使得对海量数据的随机访问变得可行。

3.HBase的存储表存储密度小，因而用户可以对行定义成不同的列；而Hive是逻辑表，属于稠密型，即定义列数，每一行对列数都有固定的数据。

4.Hive一般是做大数据量的离线数据分析，比如日志数据分析，但是不能做实时查询，因为需要很长时间才能返回结果；HBase适合用来对数据量很大的明细数据进行实时查询,如订单数据，用户画像数据。

以上就是Hive与HBase的区别及应用场景，但是只是说了一部分，两者的区别与应用肯定不止这些，还需要我们在以后的学习中，多加挖掘！

6个日的梦想

关注

4
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。