复习Hive之基本概念

最新推荐文章于 2024-08-09 17:47:29 发布

daladalabao

最新推荐文章于 2024-08-09 17:47:29 发布

阅读量662

点赞数 1

分类专栏： hive 文章标签： hive hadoop big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45450889/article/details/122977065

版权

hive 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

Hive是什么

hive是基于Hadoop的一个数据仓库工具，能够将结构化的数据映射成为一张表，提供类SQL的查询
本质是转化成mapReduce程序

为什么使用Hive

简单容易上手
对实时性要求不高的时候使用
适合处理大数据
可以自定义函数

架构

在这里插入图片描述
由上图可以看出一共由5个部分组成，Mapreduce和HDFS可以归属于Hadoop

Client
Meta Store：表名、表所属的数据库（默认是default）、表的拥有者、列/分区字段、表的类型（是否是外部表）、表的数据所在目录等
Driver：
- 解析器
- 优化器
- 编译器
- 执行器
Hadoop：Hdfs用于存储，MapReduce用于计算

运行机制

hive接收到SQL语句，使用自己的Driver并结合元数据，将SQL翻译成mapReduce，提交到Hadoop中执行，最后将结果返回

Hive和数据库有哪些区别

数据存储位置：Hive是存储在HDFS上面，而其他数据库的存储位置一般为磁盘
Hive不支持数据的修改比如insert
Hive没有索引
数据库有自己的执行引擎，而Hive是转成MapReduce
数据规模，HIve支持大数据
HIve是建立在Hadoop之上的，所以Hadoop的可扩展性Hive同样拥有

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复习Hive之基本概念

Hive是什么hive是基于Hadoop的一个数据仓库工具，能够将结构化的数据映射成为一张表，提供类SQL的查询本质是转化成mapReduce程序为什么使用Hive简单容易上手对实时性要求不高的时候使用适合处理大数据可以自定义函数架构由上图可以看出一共由5个部分组成，Mapreduce和HDFS可以归属于HadoopClientMeta Store：表名、表所属的数据库（默认是default）、表的拥有者、列/分区字段、表的类型（是否是外部表）、表的数据所在目录等Driver
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。