Hive基本介绍（一）

最新推荐文章于 2022-10-20 15:36:18 发布

刘金超DT

最新推荐文章于 2022-10-20 15:36:18 发布

阅读量500

点赞数

分类专栏： Hive 文章标签： Hive 大数据 Hadoop Hive与MySQL关系

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45399233/article/details/100556181

版权

Hive是一个基于Hadoop的数据仓库工具，提供SQL-like查询功能，用于处理大规模结构化数据。它不支持实时查询和行级更新，适合大数据批量处理。Hive将SQL语句转换为MapReduce作业执行，元数据存储在数据库如MySQL中，数据存储在HDFS中，支持多种文件格式。Hive与关系型数据库不同，更适用于批量统计分析。

摘要由CSDN通过智能技术生成

一、什么是Hive

Hive 是一种底层封装了Hadoop 的数据仓库处理工具，本质是将SQL语句通过解释器转换为MapReduce作业提交到Hadoop集群上进行计算，将结构化的数据映射为一张数据库表，并提供HQL(Hive SQL)查询功能，不用编写具体的MapReduce方法。所有Hive 的数据都存储在Hadoop 兼容的文件系统（如HDFS）中。Hive 在加载数据过程中不会对数据进行任何的修改，只是将数据移动到HDFS中Hive设定的目录下。
Hive不提供实时的查询和基于行级的数据更新操作，不适用于低延迟的应用，例如：联机事物处理(OLTP)。Hive最佳使用场景是大数据的批量处理作业，例如：网络日志分析

二、Hive特点

直接使用hadoop所面临的问题

人员学习成本太高
项目周期要求太短
MapReduce实现复杂查询逻辑开发难度太大

使用Hive后带来的好处

直接使用类SQL语法，提供快速开发的能力。
避免了去写MapReduce，减少开发人员的学习成本。
功能扩展很方便。

Hive特点

可扩展：Hive可以自由的扩展集群的规模，一般情况下不需要重启服务。

延展性：Hive支持用户自定义函数，用户可以根据自己的需求来实现自己的函数。

容错：良好的容错性，

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Hive基本介绍（一）

一、什么是HiveHive 是一种底层封装了Hadoop 的数据仓库处理工具，本质是将SQL语句通过解释器转换为MapReduce作业提交到Hadoop集群上进行计算，将结构化的数据映射为一张数据库表，并提供HQL(Hive SQL)查询功能，不用编写具体的MapReduce方法。所有Hive 的数据都存储在Hadoop 兼容的文件系统（如HDFS）中。Hive 在加载数据过程中不会对数据进行任...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

刘金超DT 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。