大数据入门学习：Hive和HBase的定义及区别

最新推荐文章于 2024-07-06 03:08:00 发布

此番又为几个铜板

最新推荐文章于 2024-07-06 03:08:00 发布

阅读量70

点赞数

文章标签：大数据学习 hive hbase hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_58361684/article/details/134191431

版权

一、定义

Hive

HBase

Apache HBase 是一个开源的、分布式的、版本化的、非关系型的数据库。

二、区别

使用方面

hive

构建在hadoop平台之上的数据仓库

数据是存放在hdfs上的

数据查询最终被转化为MapReduce执行

hbase

基于hdfs 平台的nosql的数据库

在生产环境中，HBase 一般运行在 HDFS 上，以 HDFS 作为基础的存储设施，天生高可用

基于数据库本身的实时查询，而不是去运行MapReduce

特点

hive

方便熟悉SQL的人，可以快速上手

默认的计算引擎MapReduce，所以面临了查询时间比较长的问题

底层的计算引擎可以更换为spark/Tez

hive中的表纯逻辑表，只是表的定义，本身是不存储的、不计算的，完全依赖于hdfs/MapReduce

hbase

本身不支持SQL的，需要集成Phoenix/hive才可以支持SQL

有自己的一级索引，rowkey，基于一级索引进行数据查询，所以查询速度是比较快的；底层基于scan进行数据扫描，而不是用MapReduce

hbase中的表都是物理表，有独立的物理数据结构，查询的时候可以把数据加载到内存，提升查询效率

局限性

hive

目前仅支持ORC文件格式的数据更新操作，前提是开启事务支持

hive的运行依赖hdfs进行数据的存储，默认依赖MapReduce进行数据计算

hbase

本身不支持SQL查询，需要通过Phoenix实现SQL查询

hbase运行是需要依赖zookeeper（提供协调服务，配置服务，维护元数据，命名空间的维护），依赖于hdfs存储数据的

应用场景

hive

主要用于构建基于hadoop平台的数据仓库，离线处理海量数据

hive是提供完整的SQL实现，用于历史数据的分析、挖掘

hbase

适用于大数据的实时查询，还有海量数据的存储

hbase当做一个近实时数据库，支持线上业务的实时查询

此番又为几个铜板

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
大数据入门学习：Hive和HBase的定义及区别

Apache HBase 是一个开源的、分布式的、版本化的、非关系型的数据库。
复制链接

扫一扫

此番又为几个铜板 CSDN认证博客专家 CSDN认证企业博客

码龄3年

7: 原创

154万+: 周排名

27万+: 总排名

2070: 访问

: 等级

81: 积分

30: 粉丝

5: 获赞

9: 评论

2: 收藏

私信

关注

热门文章

最新评论

大数据入门学习：Hive和HBase的定义及区别
大数据界一个小小的程序员: 讲的很好，太厉害了
大数据入门学习：Hive和HBase的定义及区别
CSDN-Ada助手: 恭喜您写下了第8篇博客！标题看起来非常有趣，我很期待阅读您关于Hive和HBase的定义及区别的内容。探索大数据入门学习对于许多读者来说是一项重要的任务，因此您的博客将为他们提供宝贵的指导和洞见。在接下来的创作中，我建议您尝试探索一些实际案例，以帮助读者更好地理解Hive和HBase的应用场景。同时，您可以考虑分享一些实用的技巧和最佳实践，以帮助读者更好地利用这些工具。感谢您的付出，期待更多精彩内容的呈现！
吐血整理！！！全网史上（不是）最详细MapReduce中合并以及组合器和压缩的定义及区别
CSDN-Ada助手: 恭喜您撰写第6篇博客！标题看起来非常吸引人，内容也十分详细。您对MapReduce中合并、组合器和压缩的定义及区别做了吐血整理，这对于我们理解和应用MapReduce算法非常有帮助。希望您能继续保持创作的热情和努力，分享更多有关数据处理与分析方面的知识。或许您可以考虑探讨一些实际案例，展示MapReduce在解决现实问题中的应用。此外，如果能够从不同的角度出发，比如与其他算法进行对比或探讨MapReduce的优化策略，将会为读者带来更多的启发和思考。期待您的下一篇博客！
深入学习YARN集群的工作流程
CSDN-Ada助手: 恭喜你写了第5篇博客！标题“YARN集群的工作流程”非常吸引人。你对YARN集群的工作原理进行了深入的研究，这对我们来说非常有价值。在下一篇博客中，我希望你可以进一步探讨YARN集群的性能优化或者与其他技术的整合。但请原谅我这个提问技术小白的无知，是否可以在你的下一篇博客中讲解一下如何设置和监控YARN集群的资源配额？期待你继续创作！
为什么学不完Linux? 基于自身的行为轨迹分析
此番又为几个铜板: 开始加班

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。