大数据二Hive的优缺点，Hive与数据库的区别

最新推荐文章于 2025-08-05 14:59:22 发布

原创

最新推荐文章于 2025-08-05 14:59:22 发布 · 1.5k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#hive

大数据二

Hive

1 Hive介绍

1.1 概述

Hive:由Facebook开源用于解决海量结构化日志的数据统计。

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。

本质是：将HQL转化为MapReduce程序

Hive处理的数据存储在HDFS

Hive分析数据底层的实现是MapReduce

执行程序在Yarn上

1.2 Hive的优缺点 *

1.2.1 优点

操作接口采用类SQL语法，提供快速开发的能力（简单、容易上手）。
避免了去写MapReduce，减少开发人员的学习成本。
Hive的执行延迟比较高，因此Hive常用于数据分析，对实时性要求不高的场合。
Hive优势在于处理大数据，对于处理小数据没有优势，因为Hive的执行延迟比较高。
Hive支持用户自定义函数，用户可以根据自己的需求来实现自己的函数。

1.2.2 缺点

1．Hive的HQL表达能力有限

（1）迭代式算法无法表达 (不断对结果进行处理)

（2）数据挖掘方面不擅长，由于MapReduce数据处理流程的限制，效率更高的算法却无法实现。

2．Hive的效率比较低

（1）Hive自动生成的MapReduce作业，通常情况下不够智能化

（2）Hive调优比较困难，粒度较粗

1.3 特点

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

流火十二

关注关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【Hive---02】hive概述『 what | 优缺点 | 架构 | Hivevs MySQL』

渐渐的忘记，赶不上明天（读研ing，2024年毕业）

10-21

1118

1. 什么是Hive？ 2. Hive优缺点 3. Hive架构 4. Hivevs MySQL

【大数据】一篇认识Hive

m0_46181896的博客

10-09

3927

文章目录一、数据仓库1.1、数据仓库概念1.2、数据仓库核心特征1.3、数据库和数据仓库的区别1.4、数据仓库分层架构[**重要**]1.5、ETL和ELT二、Apache Hive2.1、Hive的概念2.2、Hive的架构组件(非常重要)2.3、Hive和Mysql的区别三、Hive安装3.1、Metadata、metastore3.2、Hive的安装部署模式3.3、Hive的远程模式部署安装3.3.1、安装Hadoop3.3.2、安装MySQL3.3.3、安装Hive (==选择node1安装==)四

参与评论您还未登录，请先登录后发表或查看评论

Hive的基本概念及其安装

weixin_43457608的博客

10-09

294

一、Hive基本概念 1.1 什么是Hive Hive：由Facebook开源用于解决海量结构化日志的数据统计。 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。本质是：将HQL转化成MapReduce程序 1）Hive处理的数据存储在HDFS 2）Hive分析数据底层的实现是MapReduce 3）执行程序运行在Yarn上 1.2 Hive的优缺点 1.2.1 优点操作接口采用类SQL语法，提供快速开发的能力（简单、容易上手）。避免了去写M

Hive原理与不足

风之谷

01-31

6745

UHP博客文章地址：http://yuntai.1kapp.com/?p=1035 原创文章，转载请注明出处：http://blog.csdn.net/wind5shy/article/details/8560059 架构 UI：用户提交查询请求与获得查询结果。包括三个接口：命令行（CLI）、Web GUI（Hue）和客户端。Driver：接受查询请求与返回查

Hive的优缺点

My_wife_QBL的博客

07-27

1007

Apache Hive 是一个强大的大数据仓库工具，具有兼容 SQL、处理海量数据、可扩展性强和支持多种存储格式等优点。它适用于大规模数据分析、ETL 和数据处理流水线等任务。然而，Hive 也存在查询延迟较高、不支持实时更新、事务支持有限和索引功能较弱等缺点。在使用 Hive 时，需根据具体应用场景和需求，选择合适的工具和配置，以发挥其最大优势。希望本文能帮助大家更好地理解 Hive 的优缺点，并在实际项目中合理应用这项技术。

大数据面试 Hive 八股文

02-20

2. **Hive与数据库的区别** - **事务处理**：数据库支持事务，而Hive在高版本之前不支持。 - **执行效率**：数据库响应快，适合实时操作；Hive在大数据量下通过并行计算展现优势。 - **数据修改**：Hive不推荐...

尚硅谷大数据技术hive学习笔记

10-27

"尚硅谷大数据技术hive学习笔记" Hive 是一个基于 Hadoop 的数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类 SQL 查询功能。 Hive 的核心是将 HQL 转化成 MapReduce 程序，通过 SQL 语言中常用的操作...

大数据领域 Hive 数据压缩与存储优化

最新发布

大数据洞察的博客

08-05

785

在数据量呈指数级增长的今天，Hive作为大数据生态系统中的数据仓库基石，其存储效率和查询性能直接影响企业的运营成本和决策速度。本文将深入探讨Hive数据压缩与存储优化的核心技术，从基础原理到高级实践，为您揭示如何在不牺牲查询性能的前提下，显著降低存储成本并提升处理效率。我们将系统比较各类压缩算法的优劣，详解ORC与Parquet等列式存储格式的内部机制，并通过真实案例展示如何构建高效的Hive数据存储架构。

Hive的不足

一个菜鸟的博客

01-07

577

不足执行引擎 Hive架构于MapReduce Framework之上，执行计划的灵活性较差，优化器可做的选择很少，例如：Join算法只有Grace Hash Join一种选择，性能更加优秀且稳定的Hybrid Hash Join则无法实现; Map端的Group-by算法只有Hash Group-by一种选择, Reduce端的Group-by只有sort group-by一种选择(不然Ma

【大数据技术Hadoop+Spark】Hive数据仓库架构、优缺点、数据模型介绍（图文解释超详细）

showswoller的博客

12-16

2384

【大数据技术Hadoop+Spark】Hive数据仓库架构、优缺点、数据模型介绍（图文解释超详细）

hive优缺点及应用场景

Summer2381的博客

08-02

2566

（一）hive的优点 (1)简单容易上手：提供了类SQL查询语言HQL (2)可扩展：为超大数据集设计了计算/扩展能力（MR作为计算引擎，HDFS作为存储系统）一般情况下不需要重启服务Hive可以自由的扩展集群的规模。 (3)提供统一的元数据管理 (4)延展性：Hive支持用户自定义函数，用户可以根据自己的需求来实现自己的函数 (5)容错：良好的容错性，节点出现问题SQ...

hive的优缺点

w5201314ws6123的博客

02-16

3309

A:hive的本质:是将hql语句转换成mapredue去执行 1>优点：a:操作接口采用类sql语法,提供快速开发的能力 b:避免去屑mr程序,减少开发成本,减少mr的学习成本 c:hive的延迟比较高，比较适用用大量数据的统计分析,主要用于离线统计分析，对于实时要求不高的场合 ...

hive优缺点

热门推荐

tugangkai的专栏

10-04

1万+

（一）hive的优点(1)简单容易上手：提供了类SQL查询语言HQL(2)可扩展：为超大数据集设计了计算/扩展能力（MR作为计算引擎，HDFS作为存储系统）一般情况下不需要重启服务Hive可以自由的扩展集群的规模。(3)提供统一的元数据管理(4)延展性：Hive支持用户自定义函数，用户可以根据自己的需求来实现自己的函数(5)容错：良好的容错性，节点出现问题SQL仍可完成执行（二）hive的缺点（...

Hive优缺点

weixin_38023225的博客

11-05

594

1 概念 Hive：由Facebook开源用于解决海量结构化日志的数据统计。 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。本质是：将HQL转化成MapReduce程序 1）Hive处理的数据存储在HDFS 2）Hive分析数据底层的实现是MapReduce 3）执行程序运行在Yarn上 2 优缺点 2.1 优点操作...

Hive（一）简单介绍功能 优缺点

是个好男人的博客

05-16

2276

1.Hive概述 Hive是基于Hadoop的开源的数据仓库框架，提供了一种类SQL的语言HQL来处理数据，使熟悉SQL的用户能查询数据。其原理是将HiveQL转换为MapReduce任务，从而完成海量数据的查询和分析。HiveQL能通过实现用户自定义函数（UDF）、用户自定义聚合函数（UDAF）、用户自定义表函数（UDTF）进行扩展。基于Hadoop，Hive具有以下特点：易于进行数据抽取、转换和加载（ETL）支持多样的数据存储格式能直接访问存储在HDFS上或者...

mysql与hive比较

微电子学与固体电子学-俞驰

12-14

1045

由于Hive是采用的写时模式，因此数据在加载的过程中不会被校验，因此也不会对数据建立索引。但是Hive并非不支持索引，只是Hive的索引只能建立在表的列上，而不支持主键或者外键。Hive的索引分为紧凑索引和位图索引。紧凑索引适用于值已经经过聚簇处理的情况，而位图索引适用于值的取值范围较小的情况。其实对于更新、事务和索引，并非Hive不支持，而是影响性能，不符合最初数据仓库的设计理念。但是随着时间的发展，Hive在很多方面也做出了妥协，这也导致了Hive和传统数据库的区别越来越小。 ..

Hive与Mysql数据库比较

h304812440的博客

07-26

6295

经常会被一些不懂大数据的开发问： Hive是什么？Hive与传统型数据库有什么区别？ Hive是一个基于Hadoop的数据仓库平台。 Hive定义了一个类似于SQL的查询语言：HQL，能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。今天就以Mysql为例，简单比较一下两者区别。查询语言 HQL SQL 数据存储位置 HDFS...

尚硅谷大数据技术Hive详解

"大数据之hive笔记" 这篇笔记主要介绍了Apache Hive，一个基于Hadoop的数据仓库工具，用于处理和分析大规模的结构化数据。Hive由Facebook开源，它提供了类SQL查询语言（HQL），简化了对存储在HDFS上的大量数据进行...