Hive01：什么是Hive?

最新推荐文章于 2024-07-02 03:45:00 发布

做一个有趣的人Zz

最新推荐文章于 2024-07-02 03:45:00 发布

阅读量248

点赞数 1

分类专栏： hive 文章标签： hadoop hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40612128/article/details/123244789

版权

hive 专栏收录该内容

37 篇文章 0 订阅 ¥59.90 ¥99.00

订阅专栏

Hive是一个建立在Hadoop上的数据仓库工具，提供类SQL查询语言HQL进行数据处理。它不存储数据，而是依赖HDFS，支持多种文件格式如TextFile、SequenceFile、RCFile等。Hive的系统架构包括MapReduce、Tez、Spark和Flink等多种计算引擎。Metastore是Hive的元数据存储，通常推荐使用MySQL作为外置存储以支持多用户访问和元数据共享。

摘要由CSDN通过智能技术生成

一、什么是Hive

Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载，可以简称为ETL。

Hive 定义了简单的类SQL查询语言，称为HQL，它允许熟悉SQL的用户直接查询Hadoop中的数据，同时，这个语言也允许熟悉MapReduce的开发者开发自定义的mapreduce任务来处理内建的SQL函数无法完成的复杂的分析任务。

Hive中包含的有SQL解析引擎，它会将SQL语句转译成M/R Job,然后在Hadoop中执行。

通过这里的分析我们可以了解到Hive可以通过sql查询Hadoop中的数据，并且sql底层也会转化成mapreduce任务，所以hive是基于hadoop的。

二、Hive的数据存储

Hive的数据存储基于Hadoop的 HDFS
Hive没有专门的数据存储格式
Hive默认可以直接加载文本文件（TextFile），还支持SequenceFile、RCFile等文件格式
针对普通文本数据，我们在创建表时，只需要指定数据的列分隔符与行分隔符，Hive即可解析里面的数据

三、Hive的系统架构

下面我们来分析一下Hive的系统架构
看这个图，下面表示是Hadoop集群，

了解本专栏

做一个有趣的人Zz

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

做一个有趣的人Zz 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。