Hive入门

“正”♡♧♢♤

于 2024-03-12 14:19:23 发布

阅读量391

点赞数 10

文章标签： hive hadoop 数据仓库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_63735758/article/details/136649841

版权

1.1认识Hive

1.什么是Hive

Hive是一个基于Hadoop的数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，同时可以将SQL语句转化成MApReduce作业进行运行。

2.Hive的特点与优势

特点：

HQL与SQL有着相似的语法，大大提高了开发效率。

Hive支持运行不同的计算框架，包括YARN，Tez，Spark，Flink等。

Hive支持HDFS与HBase上的ad-hoc。

Hive支持用户自定义的函数，脚本等。

Hive支持Java数据库连接与开放数据库连接驱动，建立了自身与ETL，BI工具的通道。

优势：

可扩展：Hive可以自由扩展集群的规模，一般情况下无需重启服务器。

可延展：Hive支持用户自定义函数，用户可以根据自己的服务需求来编写自定义函数。

可容错：Hive良好的容错性使得节点出现问题时SQL乃可以完成执行。

1.2 Hive架构设计

1.HIve架构图

（1）Hive 客户端（Hive Clients）

（2）Hive 服务端（Hive Services）

（3）Hive 存储与计算（Hive Storage and Computing）

1.3 Hive工作流程

1.执行查询：Hive接口（如命令行或UI）通过发送查询驱动程序执行查询。

2.获取计划：在驱动程序帮助下查询编译器，并分析查询语法，查询计划以及查询要求。

3.获取元数据：编译器发送元数据请求至Metastore。

4.发送元数据：Metastore发送元数据至编译器以响应之。

5.发送计划：编译器检查查询要求，并重新发送查询计划至驱动程序；至此，查询解析与编译完成。

6.执行计划：驱动程序发送执行计划至执行引擎。

7.执行任务：执行任务的过程是完成一个MapReduce 工作的过程。执行引擎发送作业至JobTracker，JobTracker 再把作业分配到 TaskTracker;在 TaskTracker 中查询计划将执行 MapReduce工作。同时，执行引擎可以通过Metastore 执行元数据操作。

8.获取结果：执行引擎接收来自数据节点的结果。。

9.发送结果：执行引擎发送结果至驱动程序。

10.发送结果：驱动程序发送结果至 Hive接口。

1.4 Hive 适用场景

1.适用场景：

Hive 适用于非结构化数据的离线分析统计场合。
Hive 的执行延迟比较高，因此适用于对实时性要求不高的场合。
Hive的优势在于处理大数据，因此适用于大数据(而非小数据)处理的场合。

2.场景技术特点：

为超大数据集设计了计算与扩展功能。
支持 SOLlike 查询语言。
支持多表的join 操作。
支持非结构化数据的查询与计算。
提供数据存取的编程接口，支持JDBC、ODBC。

“正”♡♧♢♤

关注

10
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
Hive入门

Hive是一个基于Hadoop的数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，同时可以将SQL语句转化成MApReduce作业进行运行。
复制链接

扫一扫

“正”♡♧♢♤ CSDN认证博客专家 CSDN认证企业博客

码龄3年

8: 原创

151万+: 周排名

13万+: 总排名

5970: 访问

: 等级

202: 积分

84: 粉丝

122: 获赞

3: 评论

90: 收藏

私信

关注

热门文章

最新评论

Hive 元数据
CSDN-Ada助手: 恭喜您写了第6篇博客！对于Hive元数据的探讨很有深度，让读者受益良多。希望您能继续保持创作的热情和努力，为大家分享更多有价值的内容。或许下一步可以深入探讨Hive的优化技巧或者与其他大数据工具的整合应用，期待您的更多精彩文章！祝您创作愉快，谢谢您的分享！
Hive 基本操作命令与介绍
CSDN-Ada助手: 恭喜您在博客世界中不断努力，第7篇博文“Hive 基本操作命令与介绍”内容详实，让读者受益匪浅。希望您能继续保持创作的热情与耐心，不断挖掘更多有价值的主题，或许可以考虑深入探讨Hive在大数据处理中的应用案例，为读者提供更加实用的知识。期待您的下一篇作品！祝愿您一切顺利。
Hive数据存储模型
CSDN-Ada助手: 恭喜您发布了第三篇博客！标题“Hive数据存储模型”听起来非常有深度和实用性。希望您能继续坚持创作，分享更多关于数据存储模型的知识。或许下一步可以深入探讨不同数据存储模型的优缺点，或者结合实际案例分析数据存储模型的应用。谢谢您的分享，期待您的更多精彩文章！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Hive 数据类型
CSDN-Ada助手: 恭喜您发表了关于“Hive 数据类型”的博客，内容十分丰富和有深度。希望您能继续保持创作的热情和努力，为读者带来更多有价值的内容。建议您在下一篇博客中可以探讨一下Hive 数据类型的应用场景和实际案例，让读者更好地理解和应用这些知识。期待您的下一篇精彩作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Hive入门
CSDN-Ada助手: 很棒的博文！对于Hive这一数据仓库工具的入门介绍让人受益匪浅。希望你能继续分享更多关于Hive以及其他数据仓库工具的知识和经验。另外，除了Hive之外，你还可以探索一下Hadoop生态系统中的其他工具，比如HBase、Sqoop等，这些工具也都是大数据领域中非常重要的组成部分，相信对你的职业发展也会有很大帮助。期待你的更多精彩内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。