Hive安装与配置及常见问题解决

白桃気泡水-

已于 2022-10-14 10:35:33 修改

阅读量1k

点赞数 1

分类专栏： Java Hadoop hive 文章标签： hive 大数据 hadoop

于 2022-10-14 10:33:33 首次发布

本文链接：https://blog.csdn.net/qq_51691017/article/details/127314234

版权

摘要由CSDN通过智能技术生成

1、Hive简介

1.1Hive概述

hive是基于Hadoop构建的一套数据仓库分析系统，它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据：可以将结构化的数据文件映射为一张数据库表，并提供完整的SQL查询功能；可以将SQL语句转换为MapReduce任务运行，通过自己的SQL查询分析需要的内容，这套SQL简称Hive SQL，使不熟悉mapreduce的用户可以很方便地利用SQL语言查询、汇总和分析数据。而mapreduce开发人员可以把自己写的mapper和reducer作为插件来支持hive做更复杂的数据分析。它与关系型数据库的SQL略有不同，但支持了绝大多数的语句如DDL、DML以及常见的聚合函数、连接查询、条件查询。它还提供了一系列的工具进行数据提取转化加载，用来存储、查询和分析存储在Hadoop中的大规模数据集，并支持UDF（User-Defined Function）、UDAF(User-Defined AggregateFunction)和UDTF（User-Defined Table-Generating Function），也可以实现对map和reduce函数的定制，为数据操作提供了良好的伸缩性和可扩展性。

注意：如今随着大数据的发展Hive逐步舍弃了MR。Hive2.X版本已经建议不再使用MR，而在新出来的Hive3.X版本中，直接舍弃了使用MR作为底层运行机制，改为使用Tez。后来由于Spark的出现，许多公司开始使用Spark代替MapReduce作为Hive的执行引擎，使Hive运行在Spark上。也就是Hive on Spark。

2、Hive的安装与配置

（1）上传，导tar包

上传tar包,并查看jar包是否上传成功

解压，并将解压后得到的apache-hive-2.3.3改为更方便的hive-2.3.3

命令：（解压）tar -zxvf apache-hive-2.3.3-bin.tar.gz

（更改名称）mv apache-hive-2.3.3-bin hive-2.3.3

最低0.47元/天解锁文章

白桃気泡水-

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Hive安装与配置及常见问题解决

hive是基于Hadoop构建的一套数据仓库分析系统，它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据：可以将结构化的数据文件映射为一张数据库表，并提供完整的SQL查询功能；可以将SQL语句转换为MapReduce任务运行，通过自己的SQL查询分析需要的内容，这套SQL简称Hive SQL，使不熟悉mapreduce的用户可以很方便地利用SQL语言查询、汇总和分析数据。而mapreduce开发人员可以把自己写的mapper和reducer作为插件来支持hive做更复杂的数据分析。
复制链接

扫一扫