Hive和Habse了解

最新推荐文章于 2024-11-09 22:26:44 发布

服软⁵²º₅₂₁

最新推荐文章于 2024-11-09 22:26:44 发布

阅读量47

点赞数

文章标签： hive hadoop 数据仓库

原文链接：https://blog.csdn.net/qq_43141726/article/details/120942102

版权

Hive是一个基于Hadoop的数据仓库工具，提供SQL查询功能，用于数据处理和计算。Hbase则是一个分布式NoSql数据库，专注于实时数据查询。两者都利用HDFS进行存储，但Hive依赖MapReduce进行计算，而Hbase提供快速的随机读写能力。在大数据架构中，它们常配合使用，Hive处理后的数据可以被存入Hbase以供实时查询。

摘要由CSDN通过智能技术生成

1、Hive

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能。
Hive本身不存储和计算数据，它完全依赖于HDFS和MapReduce，Hive中的表纯逻辑。hive需要用到hdfs存储文件，需要用到MapReduce计算框架。
hive可以认为是map-reduce的一个包装。hive的意义就是把好写的hive的sql转换为复杂难写的map-reduce程序。

2、Hbase

HBase：HBase是Hadoop的数据库，一个分布式、可扩展、大数据的存储。
hbase是物理表，不是逻辑表，提供一个超大的内存hash表，搜索引擎通过它来存储索引，方便查询操作
hbase可以认为是hdfs的一个包装。他的本质是数据存储，是个NoSql数据库；hbase部署于hdfs之上，并且克服了hdfs在随机读写方面的缺点。

3、共同点

Hbase与Hive都是架构在hadoop之上的。都是用HDFS作为底层存储。

4、两者联系

Hbase和Hive在大数据架构中处在不同位置，Hbase主要解决实时数据查询问题，Hive主要解决数据处理和计算问题，一般是配合使用。

在大数据架构中，Hive和HBase是协作关系，数据流一般如下图：

通过ETL工具将数据源抽取到HDFS存储；
通过Hive清洗、处理和计算原始数据；
HIve清洗处理后的结果，如果是面向海量数据随机查询场景的可存入Hbase
数据应用从HBase查询数据；

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。