Hive 工作机制

最新推荐文章于 2022-08-15 10:47:26 发布

你看这人，真菜

最新推荐文章于 2022-08-15 10:47:26 发布

阅读量482

点赞数

分类专栏： Hive

Hive 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Hive 简介

Hive 是一个基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一个表，
并提供SQL查询功能，可将SQL语句转换为MapReduce任务进行。

优点：学习成本低、可以通过类SQL语句快速实现MapReduce统计。

Hive 工作机制

将清洗过的数据放入到HDFS中，就可以进行各种统计了
Hive运行时，元数据信息存储在关系型数据库里面，如Mysql，derby。Hive中的元数据包括表的名字、表的列和分区及其属性，表的属性、表的数据所在目录等。
Hive的数据存储在HDFS中，大部分的查询计算由MapReduce完成。
可以在Hive中建表
然后可使用SQL语句查询，每一个SQL语句都被HIve的语法解析器解析，组装成一个MapReduce程序，然后提交给yarn，运行完成后可以把结果输出出来，也可以把表写到其他表里。

与Hadoop的关系

Hive利用HDFS存储数据，利用MapReduce查询数据

你看这人，真菜

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Hive 工作机制

Hive 简介Hive 是一个基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一个表，并提供SQL查询功能，可将SQL语句转换为MapReduce任务进行。优点：学习成本低、可以通过类SQL语句快速实现MapReduce统计。Hive 工作机制将清洗过的数据放入到HDFS中，就可以进行各种统计了Hive运行时，元数据信息存储在关系型数据库里面，如Mysql，der...
复制链接

扫一扫

专栏目录

你看这人，真菜 CSDN认证博客专家 CSDN认证企业博客

码龄6年

361: 原创

17万+: 周排名

113万+: 总排名

37万+: 访问

: 等级

6343: 积分

88: 粉丝

202: 获赞

48: 评论

1090: 收藏

私信

关注

热门文章

分类专栏

基础学习 1篇
力扣LeetCode 225篇
面经总结 12篇
剑指 offer 69篇
Java 程序员面试笔记 6篇
大数据 19篇
Java 31篇
Hive 6篇
Kafka 2篇
Maven 2篇
算法与数据结构 28篇
sparkml 4篇

最新评论

[浙大数据结构] 01-复杂度3 二分查找 (20分)
RoseMicro: 有完整的代码吗？我这里一直显示各种重定义
Hadoop 出现用户定义错误解决方案
嘻嘻>_<: 会报这样的错：WARNING: HADOOP_SECURE_DN_USER has been replaced by HDFS_DATANODE_SECURE_USER. Using value of HADOOP_SECURE_DN_USER. 然后我把文章中添加的HADOOP_SECURE_DN_USER=hdfs删除了就好了。总之还是谢谢作者了
Mac 在使用git时， fatal: Could not read from remote repository.
p3095458523: 博主一只殿鹿有写，标题和这个文章的标题很像
一文了解 if, else if, else 区别和使用
Red561: if判断之后只剩一种情况了，这个时候用else if 还是else 好，跟性能有关系吗？
一文了解 if, else if, else 区别和使用
看见我了请叫我去学习: else if 可有可没有,多少个都无所谓, else 可以没有,但是只要有,就只能有一个,就一定是在判断结构的最后

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。