hive(1)centos下的安装与配置

最新推荐文章于 2023-04-05 15:24:48 发布

古月慕南

最新推荐文章于 2023-04-05 15:24:48 发布

阅读量1.3k

点赞数

分类专栏： BigData-器文章标签： centos hive hadoop 数据分析 mapreduce

本文链接：https://blog.csdn.net/u013468917/article/details/50505312

版权

本文详细介绍了如何在CentOS 6.5上安装配置Hive 0.13.0，包括下载安装文件、解压、配置元数据存储在MySQL中，以及解决权限和连接问题。Hive作为运行在Hadoop YARN上的数据分析工具，简化了分布式平台的数据处理。文章涵盖了从安装MySQL客户端到设置Hive连接MySQL数据库的完整步骤，并提供可能遇到的问题及解决方案。

摘要由CSDN通过智能技术生成

Hive是运行在hadoop的yarn平台之上的数据分析工具，Hive可以将hdfs之上的文本文件映射为一张张数据表，通过sql语句就可以进行数据分析操作。Hive中的解析器会将sql语句mapreduce的job运行。hive大大简化了分布式平台的使用，主要用于离线数据处理。

系统：centos6.5

java_version：jdk1.7

hadoop版本：2.4.1

Hive_version:0.13.0

这里不再赘述java环境的安装配置。

Hive只需在一个节点上安装即可，对于伪分布式环境下，只需安装在当前主机上即可。

关于Hadoop的安装配置请参考：http://blog.csdn.net/u013468917/article/details/50965530

1、准备安装文件

首先进入 http://mirrors.hust.edu.cn/apache/ 下载hive安装包 apache-hive-0.13.0-bin.tar.gz，然后将安装包上传至linux主机，这里我用的是securecrt远程登陆linux主机，只需在命令行界面下按alt+p，即可打开sftp窗口，将hive安装文件拖至该窗口，安装文件就会被上传至当前用户主目录。

2、解压文件：

tar -zxvf  apache-hive-0.13.0-bin.tar.gz -C /cloud/

将安装文件解压到根目录下的/cloud/文件夹下，C为大写，/cloud/文件夹需要事先创建，否则会报错。

执行：vi /etc/profile

在最后一行添加环境变量：

export HIVE_HOME = /cloud/apache-hive-0.13.0-bin;

3、配置metastore：

metastore用于存储Hive的元数据信息，比如hive有哪些数据库，数据库中有那些表，表的结构，对应文本文件的位置等等元数据信息。

Hive解压之后进入解压目录下的conf目录执行：

mv hive-env.sh.template hive-env.sh

就可以直接运行 bin/hive，此时会在当前工作目录下生成一个名为metadata的derby数据库文件。这个数据库文件仅对于在当前目录下的操作有效，如果换了一个工作目录启动Hive，之前所建立的数据库和表信息全部无效，因为此时会在新目录下生成一个新的元数据文件。而且，这种derby数据库不支持多人同时访问。

为解决以上问题，可以将元数据信息存储在mysql数据库中。mysql数据库建议用yum来安装。

3.1安装mysql客户端：

yum install mysql
安装mysql 服务器端：
yum install mysql-server
yum install mysql-devel

最低0.47元/天解锁文章

古月慕南

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hive(1)centos下的安装与配置

Hive是运行在hadoop的yarn平台之上的数据分析工具，Hive可以将hdfs之上的文本文件映射为一张张数据表，通过sql语句就可以进行数据分析操作。Hive中的解析器会将sql语句mapreduce的job运行。hive大大简化了分布式平台的使用，主要用于离线数据处理。本文介绍hive在centos下的安装和配置。
复制链接

扫一扫

专栏目录