Hive-day01-简单介绍

总会有天明

于 2021-11-03 21:12:07 发布

阅读量149

点赞数

分类专栏： Hive 文章标签： hive hadoop big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AlphaG/article/details/121129805

版权

Hive 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

一：什么是Hive

1：hive简介

hive：解决海量结构化日志的数据统计工具

hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。

2：本质：将HQL转化为MapReduce程序

hive处理的数据存储在HDFS，hive分析数据底层的实现是MapReduce，执行程序运行在Yarn上。

二：Hive优缺点

1：优点

1：操作接口采用HQL语法，提供快速开发能力

2：避免了去写MapReduce，减少开发人员的学习成本

3：常用于数据分析，对实时性要求不高的场合

4：优势在于处理大数据，对于处理小数据没有优势，因为hive执行延迟比较高

5：hive支持用户自定义函数，用户可以根据自己的需求来实现自己的函数。

2：缺点

1：Hive的HQL表达能力有限

1：迭代算法无法表达

2：数据挖掘方面不擅长，由于MapReduce数据处理流程的限制，效率更高的算法却无法实现

2：Hive的效率比较低

1：Hive自动生成的MapReduce作业，通常情况不够智能化

2：Hive调优比较困难，粒度较粗

三：Hive架构原理

1：用户接口：Client

CLI（command-line interface）、JDBC/ODBC(jdbc 访问hive)、WEBUI（浏览器访问hive）

2：元数据：Metastore

元数据包括：表名、表所属的数据库（默认是default）、表的拥有者、列/分区字段、
表的类型（是否是外部表）、表的数据所在目录等；

3：Hadoop

使用HDFS 进行存储，使用MapReduce 进行计算。

4：驱动器：Driver

1：解析器（SQL Parser）：将SQL 字符串转换成抽象语法树AST，这一步一般都用第三方工具库完成，比如antlr；对AST 进行语法分析，比如表是否存在、字段是否存在、SQL语义是否有误。
2：编译器（Physical Plan）：将AST 编译生成逻辑执行计划。

3：优化器（Query Optimizer）：对逻辑执行计划进行优化。
4：执行器（Execution）：把逻辑执行计划转换成可以运行的物理计划。对于Hive 来
说，就是MR/Spark。

四、Hive和数据库的比较

1：Hive可支持大规模数据，数据库支持的数据规模较小

2：Hive不建议对数据的改写，所有的数据都是在加载的时候确定好的，读多写少。数据库的数据通常是要经常进行修改的。

3：Hive延迟高，数据库延迟低。

总会有天明

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
Hive-day01-简单介绍

一：什么是Hive 1：hive简介 hive：解决海量结构化日志的数据统计工具 hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。 2：本质：将HQL转化为MapReduce程序hive处理的数据存储在HDFS，hive分析数据底层的实现是MapReduce，执行程序运行在Yarn上。二：Hive优缺点 1：优点...
复制链接

扫一扫

专栏目录

总会有天明 CSDN认证博客专家 CSDN认证企业博客

码龄6年

122: 原创

7万+: 周排名

75万+: 总排名

5万+: 访问

: 等级

1406: 积分

95: 粉丝

55: 获赞

24: 评论

57: 收藏

私信

关注

分类专栏

面试题
spark 4篇
scala 7篇
问题报错 11篇
Hbase 5篇
Hive 12篇
Zookeeper 7篇
Hadoop 24篇
Linux 43篇
shell 8篇

最新评论

Error: Could not open client transport with JDBC Uri: jdbc:hive2://hadoop102:10000
data_boy: 还是不行，绝望
关于Linux出现xsync：command not found
图灵和柯南道尔的大弟子: 博主您好，请问/etc/profile是一个目录还是一个文件呢？按照您的表示，应该是一个目录？可是我在虚拟机里是直接可以用vim修改/etc/profile的
关于Linux出现xsync：command not found
图灵和柯南道尔的大弟子: 博主您好，请问/etc/profile是一个目录还是一个文件呢？按照您的表示，应该是一个目录？可是我在虚拟机里是直接可以用vim修改/etc/profile的
Scala-day03-运算符和循环控制
OpenYuan开袁: 非常棒，有空来我主页看看
Hbase-day02-Hbase高级
总会有天明: 摸鱼

大家在看

苹果CMS影视站SEO详细优化教程

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

总会有天明 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。