Hive介绍

最新推荐文章于 2022-05-05 16:27:41 发布

丁典

最新推荐文章于 2022-05-05 16:27:41 发布

阅读量213

点赞数

分类专栏： IT 文章标签： Hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a289237642/article/details/86622925

版权

IT 专栏收录该内容

68 篇文章 0 订阅

订阅专栏

Hive 是建立在 Hadoop 上的数据仓库基础构架。

它提供了一系列的工具，可以用来进行数据提取转化加载（ETL ），这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。

Hive 定义了简单的类 SQL 查询语言，称为 QL ，它允许熟悉 SQL 的用户查询数据。

同时，这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作。

Hive是SQL解析引擎，它将SQL语句转译成M/R Job然后在Hadoop执行。

Hive的表其实就是HDFS的目录，按表名把文件夹分开。如果是分区表，则分区值是子文件夹，

可以直接在M/R Job里使用这些数据。

Hive 相当于hadoop的可视化工具，如Mysql的可视化工具Navicat for MySQL，

oracle的可视化工具PLSQLDeveloper，它可以起很多个，而且起不同版本的。

只要环境参数配置好了。就像Navicat for MySQL和sqldeveloper可以开多个。

Hive的数据存储基于Hadoop HDFS。

Hive没有专门的数据存储格式存储结构主要包括：数据库、文件、表、视图、索引。
Hive默认可以直接加载文本文件（TextFile），还支持SequenceFile、RCFile。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hive介绍

Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL ），这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言，称为 QL ，它允许熟悉 SQL 的用户查询数据。同时，这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 red...
复制链接

扫一扫

专栏目录

丁典 CSDN认证博客专家 CSDN认证企业博客

码龄9年

78: 原创

39万+: 周排名

226万+: 总排名

7万+: 访问

: 等级

1491: 积分

40: 粉丝

27: 获赞

13: 评论

81: 收藏

私信

关注

分类专栏

IT 68篇
摄影

最新评论

python的心连心
钟子期754: 你好我为啥运行不了
centos7.x安装redis
ctotalk: 感谢分享，学以致用。
百度API-------热力图
不吃西红柿丶: 非常有用，谢谢大佬整理~

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。