实训day2

m0_74298287

已于 2024-04-23 22:19:17 修改

阅读量578

点赞数 9

文章标签： sql hadoop hive

于 2024-04-23 19:51:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74298287/article/details/138136609

版权

本文介绍了SQL在大数据分析中的重要性，特别是Hive如何作为分布式SQL计算工具，通过将SQL转化为MapReduce程序来处理数据。文章探讨了Hive的优势，如快速开发接口和底层MapReduce执行，以及HDFS的副本机制和Hive的核心架构，包括元数据管理与SQL解析器等组成部分。

摘要由CSDN通过智能技术生成

1、前言

对数据进行统计分析，SQL是目前最方便的编程工具。大数据体系中充斥着非常多的统计分析场景。所以，使用SQL去处理数据，在大数据中也是有极大的需求。MapReduce支持程序开发(python,Java等)，但不支持SQL直接进行开发。

2、分布式SQL计算-Hive

Apache Hive是一款分布式SQL计算的工具，其主要功能是：将SQL语句翻译成MapReduce程序运行。

基于Hive为用户提供了分布式SQL计算的能力写的是SQL、执行的是MapReduce。

3、为什么使用Hive

使用Hadoop MapReduce直接处理数据所面临的问题

人员学习成本太高需要掌握java python等编程语言

MapReduce实现复杂查询逻辑开发难度

使用Hive处理技术的好处

操作接口采用类SQL语法，提供快速开发的能力

底层执行MapReduce，可以完成分布式海量数据的SQL处理

4、什么是分布式SQL计算

以分布式的形式，执行SQL语句，进行数据统计分析

5、Apach Hive是做什么的?

将SQL语句翻译成MapReduce程序，从而提供用户分布式SQL计算的能力

6、HDFS的副本机制

HDFS被设计成能够在一个大集群中跨机器可靠的存储超大文件，它将每一个文件存储成一系列的数据块，这个数据块被称为blocl,除了最后一个，所有数据块都是同样大小的。

hdfs默认文件:

http://hadoop.apache.org/docs/r3.34/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml

为了容错，文件的所有block都会有副本，每个文件的数据块大小和副本系数都是可配置的。

hadoop当中，文件的block块大小默认是128M(134217728字节)

7、Driver驱动程序

Driver:包括语法解析器、计划编译器、优化器、执行器

作用:完成HQL(Hibernate Query Language)查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在HDFS中，并在随后有MapReduce调用执行。

8、Hive的核心架构包含哪些?

元数据管理:称之为Metastore服务

SQL解析器(Driver驱动程序):完成SQL解析、执行优化、代码提交等功能

用户接口:提供用户和Hive交互的功能

9、Metastore元数据存储

服务配置:内嵌模式、本地模式、远程模式

内嵌模式的优点：配置简单，解压hive安装包，启动就可以使用。

内嵌模式的缺点：不同路径启动hive，每一个hive拥有一套自己的元数据，

本地模式的优点：配置简单，本地模式下hive的配置中指定mysql的信息

本地模式的缺点：每启动一次hive服务，都内置启动了一个metastore；在hive-site.xml中暴露的数据库的连接信息。

关注

9
点赞
踩
19

收藏

觉得还不错? 一键收藏
打赏
3
评论
实训day2

HDFS被设计成能够在一个大集群中跨机器可靠的存储超大文件，它将每一个文件存储成一系列的数据块，这个数据块被称为blocl,除了最后一个，所有数据块都是同样大小的。基于Hive为用户提供了分布式SQL计算的能力写的是SQL、执行的是MapReduce。为了容错，文件的所有block都会有副本，每个文件的数据块大小和副本系数都是可配置的。内嵌模式的缺点：不同路径启动hive，每一个hive拥有一套自己的元数据，本地模式的优点：配置简单，本地模式下hive的配置中指定mysql的信息。
复制链接

扫一扫

m0_74298287 CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

198万+: 周排名

16万+: 总排名

2122: 访问

: 等级

73: 积分

34: 粉丝

27: 获赞

7: 评论

39: 收藏

私信

关注

热门文章

最新评论

实训day2
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
实训day2
普通网友: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
项目实战day4
普通网友: 优质好文，支持支持。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
项目实战day4
普通网友: 你的博客内容深入浅出，总是让我不再感到学习的困难，每一篇博文都是我学习的宝库。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
项目实战day4
普通网友: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

m0_74298287 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。