初识 Hive

陈同学q

已于 2022-03-10 10:31:39 修改

阅读量2k

点赞数

分类专栏： Hadoop 文章标签： hive hadoop big data

于 2022-03-10 10:05:22 首次发布

本文链接：https://blog.csdn.net/qq_54528857/article/details/123393256

版权

Hadoop 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

一.什么是Hive?

基于Hadoop的数据仓库工具，可将结构化数据文件映射为一张表，并提供类SQL查询功能

用于解决海量结构化日志的数据统计

本质是将HQL转化为MapReduce程序

1. Hive处理的数据存储在HDFS
2. Hive分析数据底层的实现是MapReduce
3. 执行程序运行在Yarn上

二.优缺点

a. 优点：

1. 类SQL语法（简单、易上手）

2. 避免写MapReduce，减少开发人员学习成本

3. Hive执行延迟较高，适用于处理大量数据和对实时性要求不高的数据

4. 可自定义函数，根据需求定义函数

b.缺点：

1. 表达能力有限（迭代式算法无法表达、数据挖掘方面不擅长）

2. 效率较低（不够智能化、调优较困难）

三. Hive架构原理

在这里插入图片描述

四. Hive 与数据库的比较

hive采用了类似SQL的查询语言 Hive QL (Hive Query Language)，因此容易将HIve理解为数据库

但除查询语言外，再无类似之处。

对比项	Hive	MySQL
查询语言	Hive QL	SQL
数据存储位置	HDFS	本地或块设备
数据格式	用户定义	系统决定
数据更新	不支持	支持
事务	不支持	支持
执行延迟	高	低
可扩展性	高	低
数据规模	大	小

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

陈同学q

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Hive究竟是什么？

大数据hive教程详解

01-09

1211

hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析Facebook公司最早完成并开源了hive框架，可以将sql语句直接翻译成MapRe...

初识Hive

修行的博客

06-28

302

大数据第20天-Hive Hive 一种建立在Hadoop文件系统上的数据仓库架构，并对存储在HDFS中的数据进行分析与管理 Hive架构的核心 --将数据通过SQL语句转换成MapReduce操作/转成hdfs操作数据仓库 --主要用来分析和管理数据，一般是查询操作，需要定期加载和刷新数据元数据Metastore（表字段定义，属性，存放位置等除本身数据之外的信息）存储在关系型数据库（...

参与评论您还未登录，请先登录后发表或查看评论

Hive 1、什么是Hive，Hive有什么用

02-01

217

　　一、什么是Hive 　　Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言，称为 HQL，它允许熟悉 SQL 的用户查询数据。同时，这个语言也允许熟悉 MapReduce 开发者的开发自定义的 map...

hive 是什么

weixin_45967421的博客

10-18

2427

hive 是做数据仓库的工具之一，不是数据仓库，更不是数据库； hive 是站在hdfs上面没有hdfs就没有hive， hive是建立在Hadoop 上的数据仓库基础架构。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。 hive定义了简单的类sql查询语言，成为Hql，他熟悉sql的用户查询数据。同时，这个语言也允许熟悉MapReduce开发者的开发自定的mapper和reducer 来处理内建的mapper和red

什么是hive？

wjr_wl的博客

10-18

1787

hive概念 hive的产生背景： mapreduce----统计分析用于这个统计分析的数据都是结构化的数据以后生产中接触的数据大部分都是结构化数据如果数据量比较小的时候：最好的解决方案 mysql math,wangbaoqiang,85 ...

Hive——基本概念

qq_41544550的博客

06-14

477

1、什么是Hive Hive：由Facebook开源用于解决海量结构化日志的数据统计。 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。本质是：将HQL转化成MapReduce程序 1）Hive处理的数据存储在HDFS 2）Hive分析数据底层的实现是MapReduce 3）执行程序运行在Yarn上 2、Hive的优缺点...

初识Hive--精华

10-22

1、hive的产生背景 2、hive的定义 3、hive的本地安装 4、hive的基本类型 5、hive的基本命令

菜鸟先飞之初识Hive、安装教程及常见问题

望、本归心的博客

07-08

1499

一、初识Hive 1、什么是Hive? Hive是基于Haddop的数据仓库工具，可以将结构化的数据文件映射为一张数据库表并提供SQL查询功能，可以将SQL语句转换 MapReduce任务运行。 Hive提供了一系列的工具，可以给用来数据提取转换加载（ETL）是一种存储、查询和分析存储在Hadoop中的大规模数据的机制 2、Hive发展历史及版本 2007年8月 – 始于Facebook 2013年5月 – 0.11 Stinger Phase 1 ORC HiveServer2 20.

初识 Hive：什么是 Hive 数据仓库

## 第一章：Hive 数据仓库简介 ### 1.1 什么是数据仓库数据仓库是指存储和管理大量结构化和非结构化数据的系统。它提供了一种高效管理和查询数据的方式，使得用户能够从中获取有关业务运营、决策制定等方面的有...

初识Hive：大数据处理的利器

Hive是一个基于Hadoop的数据仓库工具，可以将结构化数据文件映射为一张数据库表，并提供类SQL查询功能来分析数据。Hive提供了一个类似于SQL的查询语言，称为HiveQL，用户可以通过HiveQL来编写查询，这些查询最终被...

什么是Hive

实践求真知

11-22

624

一什么是Hive 1、Hive是构建于Hadoop HDFS之上的一个数据仓库基础架构。 2、Hive可以用来进行数据提取转化加载（ETL）。 3、Hive定义了简单的类似SQL查询语言，称为HQL，它允许熟悉SQL的用户查询数据。 4、Hive允许熟悉MapReduce开发者开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作。 5

简单介绍什么是Hive

weixin_44953126的博客

11-03

2312

简单介绍什么是Hive 什么是Hive Hive是在Hadoop中处理结构化数据的数据仓库基础设施工具。它位于hadoop之上，针对大数据，使查询和分析变得简单。最初Hive是由FaceBook开发的，后来Apache软件基金会采用了它，并以Apache Hive的名字作为一个开放源代码进行了进一步的开发。它被不同的公司使用。例如，Amazon Elastic MapReduce， Microso...

大数据系列——什么是hive？hive用来干什么的？hive常见问题是啥？

热门推荐

Philosophy7的博客

05-18

2万+

✅作者简介：大家好,我是Philosophy7？让我们一起共同进步吧！🏆 📃个人主页：Philosophy7的csdn博客 🔥系列专栏： 👑哲学语录: 承认自己的无知，乃是开启智慧的大门 💖如果觉得博主的文章还不错的话，请点赞👍+收藏⭐️+留言📝支持一下博>主哦🤞 文章目录一、Hive介绍Hive的优缺点Hive架构Hive用户接口Hive元数据的三种存储模式Hive数据存储架构原理用户接口Hadoop驱动器：DriverHive文件格式Hive本质Hive工作原理Hive数据类型一、Hive介.

干货丨数据仓库工具hive面试题集锦

weixin_51689029的博客

09-15

795

大数据技术成为互联网发展的核心要素之一，想从事大数据开发需要掌握多种核心技术：Hadoop、Hive、Storm、Spark、Scala等等。这些技术知识点已经成为大数据工程师，进入职场时面试中必备的考点。今天，和大家分享一些数据仓库工具hive相关的面试题！有3种join方式：① 在 reduce 端进行 join，最常用的 join 方式。Map端的主要工作：为来自不同表(文件)的 key/value 对打标签以区别不同来源的记录。

Hive 是什么

山鬼谣弋痕夕的博客

01-31

5421

1.Hive 是什么 hive 是一个构建在Hadoop上的数据仓库工具,它可以让结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,剋将SQL语句转换为MapReduce任务进行运行,其优点是学习成本低. hive的目的是让精通SQL技能的分析师能够在Facebook存放在HDFS的大规模数据集上进行查询操作. 目前,Hive已经成为一个通用的、可伸缩的数据处理平台. 2...

Hive简介

阿生

03-22

7775

1、Hive的起源 Hive起源于Facebook（一个美国的社交服务网络）。Facebook有着大量的数据，而Hadoop是一个开源的MapReduce实现，可以轻松处理大量的数据。但是MapReduce程序对于Java程序员来说比较容易写，但是对于其他语言使用者来说不太方便。此时Facebook最早地开始研发Hive，它让对Hadoop使用SQL查询（实际上SQL后台转化为了MapReduc

Hadoop大数据：Hive入门与核心概念解析

"本课程是关于大数据仓库Hive的精讲，主要分为初识入门、深入使用和高级进阶三个部分。课程详细介绍了Hive的体系结构、环境搭建，包括在Linux环境下安装MySQL，以及Hive的元数据配置和基本操作。Hive是Facebook为...