Hive安装与配置及常见问题解决

最新推荐文章于 2023-08-17 15:31:33 发布

Yuan_Shan_

最新推荐文章于 2023-08-17 15:31:33 发布

阅读量414

点赞数

文章标签： hive 大数据 hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Yuan_Shan_/article/details/127316232

版权

本文介绍了Hive的基本概念、优缺点以及详细的安装配置步骤，包括上传、解压、配置环境变量、初始化Hive等。此外，还强调了Hive在大数据处理中的角色，虽然查询速度较慢，但具有良好的扩展性和容错性。Hive的最新版本已支持删改操作，且可通过添加自定义函数增强功能。

摘要由CSDN通过智能技术生成

目录

2Hive的安装与配置

2.1.1把 apache-hive-2.3.3-bin.tar.gz 上传到 linux 的/usr/software 目录下

2.1.2解压apache-hive-2.3.3-bin.tar.gz

2.1.3将文件重命名为hive-2.3.3文件

2.1.4上传mysql-connector-java-5.1.49.jar

2.1.5添加以下配置信息

2.1.6给mysql赋予权限

2.1.7配置环境变量

2.1.8初始化Hive

1Hive简介

1.1概述

hive是Facebook开源，用于解决海量结构化日志的数据统计工具。是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。

本质上是将HQL转化为MapReduce程序执行

之前的定义：Hive是由Facebook实现并开源，是基于Hadoop的一个数据仓库工具，底层依赖于HDFS存储数据，利用MapReduce进行计算，可以将结构化的数据映射为一张数据库表，并提供HQL。Hive的本质是将 SQL 语句转换为 MapReduce 任务运行。Hive提供了三种协议访问 Hive数据：Thrift RPC、JDBC、ODBC。

注意：以上是Hive之前的定义。如今随着大数据的发展Hive逐步舍弃了MR。Hive2.X版本已经建议不再使用MR，而在新出来的Hive3.X版本中，直接舍弃了使用MR作为底层运行机制，改为使用Tez。

后来由于Spark的出现，许多公司开始使用Spark代替MapReduce作为Hive的执行引擎，使Hive运行在Spark上。也就是Hive on Spark。

1.2优缺点

1.2.1优点：

可扩展性强，支持横向扩展。因为其底层依赖于HDFS存储数据，支持集群扩展。Hive可以自由的扩展集群的规模，一般情况下不需要重启服务。

延展性强。支持自定义函数。

良好的容错性。底层依赖于HDFS，有副本机制。

操作接口采用类SQL语法，简单易上手。
省去了写MapReduce，减少学习成本。
支持自定义函数

1.2.2缺点：

查询起来很慢。

不支持事务。主要用来做OLAP（联机分析处理），而不是OLTP（联机事务处理）。

之前版本的Hive不支持删改操作的，但是新出来的3.0版本是支持的。
迭代式算法无法表达
数据挖掘方面不擅长，由于MapReduce数据处理流程的限制，效率更高的算法无法实现。
hive自动生成的MapReduce不够智能化
hive调优比较困难，粒度较粗

1.3架构

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hive安装与配置及常见问题解决

Hive安装与配置及常见问题解决课堂作业仅供参考
复制链接

扫一扫

Yuan_Shan_ CSDN认证博客专家 CSDN认证企业博客

码龄4年

1: 原创

193万+: 周排名

161万+: 总排名

415: 访问

: 等级

11: 积分

0: 粉丝

0: 获赞

0: 评论

0: 收藏

私信

关注

热门文章

Hive安装与配置及常见问题解决 414

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。