Hive系列(一)Hive基本概念

最新推荐文章于 2024-08-23 07:30:00 发布

淡淡的倔强

最新推荐文章于 2024-08-23 07:30:00 发布

阅读量2.8k

点赞数 1

分类专栏： Hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012834750/article/details/80492856

版权

Hive是由Facebook开源的数据仓库工具，基于Hadoop，用于处理和分析大规模结构化日志数据。它提供类SQL查询功能，降低开发人员的学习成本。Hive的特点包括高延迟、适合大数据分析、支持用户自定义函数，但不支持数据改写和添加，且无索引，执行延迟较高。

摘要由CSDN通过智能技术生成

一、Hive基本概念

1.1 什么是Hive

Hive：由Facebook开源用于解决海量结构化日志的数据统计。
Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。

本质是：将HQL转化成MapReduce程序
1）Hive处理的数据存储在HDFS
2）Hive分析数据底层的实现是MapReduce
3）执行程序运行在YARN上

1.2 为什么使用Hive

1）直接使用hadoop所面临的问题
（1）人员学习成本太高
（2）项目周期要求太短
（3）MapReduce实现复杂查询逻辑开发难度太大

2）Hive的好处
（1）操作接口采用类SQL语法，提供快速开发的能力。
（2）避免了去写MapReduce，减少开发人员的学习成本。
（3）扩展功能很方便。

1.3 Hive架构概述

这里写图片描述

如图中所示，Hive通过给用户提供的一系列交互接口，接收到用户的指令(SQL)，使用自己的Driver，结合元数据

最低0.47元/天解锁文章

淡淡的倔强

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。