Hive和HDFS

m0_74959213

已于 2024-04-23 22:09:21 修改

阅读量385

点赞数 12

文章标签： hive hdfs hadoop

于 2024-04-23 22:05:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74959213/article/details/138138033

版权

本文介绍了ApacheHive作为分布式SQL工具在大数据处理中的关键作用，包括将文件转换为表并执行SQL查询，以及利用HDFS的Master/Slave架构和副本机制来确保数据可靠性。Hive通过类SQL接口提供快速开发能力，底层实际运行MapReduce处理大规模数据。

摘要由CSDN通过智能技术生成

Hive

Apache Hive是一款分布式SQL计算工具，主要两个功能是：

1.将我们的文件转化为表结构；

2.将SQL语句翻译成MapReduce程序进行。

对数据进行统计分析，SQL是目前最为方便的编程工具，大数据体系中充斥着非常多的统计分析场景，所以使用SQL去处理数据，在大数据中也是有极大的需求的。但又因为MapReduce只支持程序开发（Java,Python等，不支持SQL直接进行开发，所以这个时候我们就需要用HIve先把SQL语句翻译成MapReduce代码才能进行。

要注意Hive只是为用户提供了分布式SQL计算的能力，相当于HIve给我们提供一个可以直接用SQL去处理Hadoop上的一些文件的通道。所以写的还是SQL，执行的却是MapReduce

使用Hive处理数据的好处：

操作接口采用类SQL语法，提供快速开发的能力；

底层执行MapReduce,可以完成分布式海量收据的SQL处理。

HDFS

HDFS的架构：

HDFS采用Master/Slave架构
一个HDFS集群有两个重要的部分是Namenode和Datanode.
HDFS的四个基本组件:HDFS Client、NameNode、DataNode和Secondary NameNode.

HDFS的副本机制

HFDS是一个能够在一个大集群中跨机器可靠地储存超大文件。它将每一个文件储存以西开裂的数据块，这个数据块被称为block，其中除了最后一个，所有的block块的大小都是相等的。

在Hadoop中，文件的block块的大小是128M.

为了防止不可控制的原因导致部分block块丢失造成文件缺失，因此文件的所有block块都会备份，其中每个文件的block块大小和副本系数都是可以配置的。

关注

12
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
Hive和HDFS

对数据进行统计分析，SQL是目前最为方便的编程工具，大数据体系中充斥着非常多的统计分析场景，所以使用SQL去处理数据，在大数据中也是有极大的需求的。它将每一个文件储存以西开裂的数据块，这个数据块被称为block，其中除了最后一个，所有的block块的大小都是相等的。为了防止不可控制的原因导致部分block块丢失造成文件缺失，因此文件的所有block块都会备份，其中每个文件的block块大小和副本系数都是可以配置的。在Hadoop中，文件的block块的大小是128M.1.将我们的文件转化为表结构；
复制链接

扫一扫

m0_74959213 CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

164万+: 周排名

16万+: 总排名

1502: 访问

: 等级

77: 积分

24: 粉丝

33: 获赞

4: 评论

21: 收藏

私信

关注

热门文章

最新评论

初学Hadoop
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Hive和HDFS
普通网友: 你的博客内容深入浅出，总是让我不再感到学习的困难，每一篇博文都是我学习的宝库。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
初学Hadoop
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Hive和HDFS
普通网友: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【无标题】
CSDN-Ada助手: 恭喜您写下第四篇博客！不过标题留空可能让读者有些迷惑，建议在下次创作时给文章起一个鲜明的标题，让读者更容易理解您的内容。继续保持创作的热情和努力，期待您的下一篇作品！愿您在写作的道路上不断进步，创作出更多优质内容。加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。