Hive的概念与基本架构

最新推荐文章于 2024-10-19 21:34:49 发布

cluse_ld

最新推荐文章于 2024-10-19 21:34:49 发布

阅读量256

点赞数 1

分类专栏： hive 文章标签： hive hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Laoddaaa/article/details/126328970

版权

1. 什么是Hive

1.1 hive简介

Hive是一个用于解决海量结构化日志的数据统计工具；是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。

hive的本质是将SQL转化为MapReduce程序

在这里插入图片描述

Hive处理的数据存储在HDFS上
Hive分析数据底层的实现是MapReduce
执行程序运行在Yarn上

hive优缺点

优点

操作接口采用类SQL语法，避免了写MapReduce，提供快速开发的能力（简单、好上手）。
Hive优势在于处理大数据，对于处理小数据没有优势，因为Hive执行延迟比较高。同理，Hive常用于数据分析等实时性要求不高的场景。
Hive支持用户自定义函数。

缺点

Hive的HQL表达能力有限，无法表达迭代算法；由于处理流程的限制，无法实现数据挖掘等效率更高的算法。
Hive的效率较低，自动生成的MapReduce作业，不够智能；调优较为困难，粒度较粗。

2. Hive的架构

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。