Hive

最新推荐文章于 2021-12-26 20:10:49 发布

qq_39950973

最新推荐文章于 2021-12-26 20:10:49 发布

阅读量190

点赞数

文章标签： mysql hadoop hdfs mapreduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39950973/article/details/116266660

版权

Hive

基于Hadoop数据保存到HDFS
数据仓库工具
结构化的数据映射为一张数据库表

01，张三，89
02，李四，91
03，赵武，92

HQL查询功能（Hive SQL）

将分布式计算的任务交给MapReduce，然后用Hive进行操作。

HQL查询功能（Hive SQL）
本质把HQL翻译成MapReduce，降低使用Hadoop计算的门槛。

离线数据分析开发效率比直接用MapReduce高

使用Hive
1、操作接口采用SQL语法，提供快速开发的能力
2、避免了去写MapReduce，减少开发人员的学习成本
3、功能扩展很方便

只要不涉及算法部分，会Hive就行，大部分都在写SQL。
在这里插入图片描述
Hive架构
1、用户接口：shell命令行
2、元数据存储
数据库表都保存到那些位置上
表中的字段名字类型
mysql derby（自带）
Drive
负责把HQL翻译成MapReduce
或者翻译成Shell命令

Hive是数据仓库工具，没有集群的概念，如果想提交Hive作业只需要在Hadoop集群Master节点上装Hive就可以了。

Hive和Hadoop关系

1、利用hdfs存数据，利用mr算
2、Hive只需要跟Master节点打交道，不需要集群。

Hive用于海量数据的离线数据分析
小数据情况下，没有SQL快，Hive的优势是海量数据。
不支持更新和删除，所以也不支持事务。
利用MapReduce执行，延迟高，子查询只能用From。

**

Hive和关系型数据库区别

**
1、Hive离线计算海量查询
2、Hive最主要做查询，不涉及删除修改，默认不支持删除修改，默认不支持事务，并不完全支持标准sql。
3、SQL CRUD全部支持，支撑在线业务，索引完整，支持事务。
4、Hive数据模型
一、Hive中所有的数据库都存储在HDFS中，没有专门的数据存储格式。

为什么要分区：
1、随着表的不断增大，对于新纪录的增加，查找，删除的维护也更加困难，对于数据库中的超大型表，可以通过把它的数据分成若干个小表，从而简化数据库的管理活动，对于每一个简化后的小表，我们称为一个单独的分区。

内置运算符：
1、关系运算符
2、算术运算符
3、逻辑运算符
4、复杂运算

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hive

Hive基于Hadoop数据保存到HDFS数据仓库工具结构化的数据映射为一张数据库表01，张三，8902，李四，9103，赵武，92HQL查询功能（Hive SQL）将分布式计算的任务交给MapReduce，然后用Hive进行操作。HQL查询功能（Hive SQL）本质把HQL翻译成MapReduce，降低使用Hadoop计算的门槛。离线数据分析开发效率比直接用MapReduce高使用Hive1、操作接口采用SQL语法，提供快速开发的能力2、避免了去写MapReduce，减少开
复制链接

扫一扫

qq_39950973 CSDN认证博客专家 CSDN认证企业博客

码龄7年

8: 原创

109万+: 周排名

123万+: 总排名

3712: 访问

: 等级

80: 积分

0: 粉丝

0: 获赞

0: 评论

5: 收藏

私信

关注

热门文章

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。