1.下载和解压安装文件
1.1基础环境和安装准备
(1)当前环境中已安装 Hadoop 全分布系统。
(2)本地安装 MySQL 数据库(账号 root,密码 Password123$),软件包在/opt/software/mysql-5.7.18 路径下。
(3)MySQL 端口号(3306)。
(4)MySQL 的 JDBC 驱动包/opt/software/mysql-connector-java-5.1.47.jar, 在此基础上更新 Hive 元数据存储。
(5)Hive 软件包/opt/software/apache-hive-2.0.0-bin.tar.gz。
1.2解压安装文件
(1)使用 root 用户,将 Hive 安装包 /opt/software/apache-hive-2.0.0-bin.tar.gz 路解压到/usr/local/src 路径下
命令: tar -zxvf /opt/software/apache-hive-2.0.0-bin.tar.gz -C /usr/local/src
(2)将解压后的 apache-hive-2.0.0-bin 文件夹更名为 hive
命令:mv /usr/local/src/apache-hive-2.0.0-bin usr/local/src/hive
(3)修改 hive 目录归属用户和用户组为 hadoop
命令:chown -R hadoop:hadoop /usr/local/src/hive
2.设置Hive环境
2.1卸载marladb数据库
(1)关闭 Linux 系统防火墙,并将防火墙设定为系统开机并不自动启动
# 关闭防火墙服务 systemctl stop firewalld
# 设置防火墙服务开机不启动 systemctl disable firewalld
(2)卸载 Linux 系统自带的 MariaDB
1)首先查看 Linux 系统中 MariaDB 的安装情况
# 查询已安装的 mariadb 软件包 rpm -qa | grep mariadb
2)卸载 MariaDB 软件包
# 卸载 mariadb 软件包 rpm -e --nodeps mariadb-libs-5.5.56-2.el7.x86_64
2.2安装mariadb软件包
(1)按如下顺序依次按照 MySQL 数据库的 mysql common、mysql libs、mysql client 软件包
# MySQL 软件包路径 /opt/software/mysql-5.7.18/
命令: rpm -ivh mysql-community-common-5.7.18-1.el7.x86_64.rpm
rpm -ivh mysql-community-libs-5.7.18-1.el7.x86_64.rpm
rpm -ivh mysql-community-client-5.7.18-1.el7.x86_64.rpm
(2)安装 mysql server 软件包
命令:rpm -ivh mysql-community-server-5.7.18-1.el7.x86_64.rpm
(3)修改 MySQL 数据库配置
将以下配置信息添加到/etc/my.cnf 文件 symbolic-links=0 配置信息的下方。
default-storage-engine=innodb
innodb_file_per_table
collation-server=utf8_general_ci
init-connect='SET NAMES utf8'
character-set-server=utf8
(4)启动 MySQL 数据库
命令:systemctl start mysqld
(5)查询 MySQL 数据库状态。mysqld 进程状态为 active (running),则表示 MySQL 数 据库正常运行。 如果 mysqld 进程状态为 failed,则表示 MySQL 数据库启动异常。此时需要排查 /etc/my.cnf 文件
命令:systemctl status mysqld
(6)查询 MySQL 数据库默认密码(需要复制)
MySQL 数据库安装后的默认密码保存在/var/log/mysqld.log 文件中,在该文件中以 password 关键字搜索默认密码。
命令:cat /var/log/mysqld.log | grep password
(7)MySQL 数据库初始化
设定密码为 Password123$
命令:mysql_secure_installation
流程:# 输入/var/log/mysqld.log 文件中查询 到的默认 root 用户登录密码
# 输入新密码 Password123$
# 再次输入新密码 Password123$
#依次输入 y y n y y
(8)添加 root 用户从本地和远程访问 MySQL 数据库表单的授权
命令: mysql -uroot -p
Enter password: # 输入新设定的密码 Password123$
# 添加root 用户本地访问授权
mysql> grant all privileges on *.* to root@'localhost' identified by 'Password123$';
# 添加 root 用 户远程访问授权
mysql> grant all privileges on *.* to root@'%' identified by 'Password123$';
# 刷新授权
mysql> flush privileges;
# 查询 root 用户授权情况
mysql> select user,host from mysql.user where user='root';
# 退出 MySQL 数据库
mysql> exit;
2.3配置Hive组件
(1)设置 Hive 环境变量并使其生效
命令:vi /etc/profile
# 在文件末尾追加以下配置内容
# set hive environment
export HIVE_HOME=/usr/local/src/hive
export PATH=$PATH:$HIVE_HOME/bin
# 使环境变量配置生效 source /etc/profile
(2)修改 Hive 组件配置文件
切换到 hadoop 用户执行以下对 Hive 组件的配置操作。
su - hadoop
将/usr/local/src/hive/conf 文件夹下 hive-default.xml.template 文件,更名为 hive-site.xml。
cp /usr/local/src/hive/conf/hive-default.xml.template /usr/local/src/hive/conf/hive-site.xml
(3)通过 vi 编辑器修改 hive-site.xml 文件实现 Hive 连接 MySQL 数据库,并设定 Hive 临时文件存储路径
vi /usr/local/src/hive/conf/hive-site.xml
2.4初始化hive元数据
(1)将 MySQL 数据库驱动(/opt/software/mysql-connector-java-5.1.46.jar)拷贝到 Hive 安装目录的 lib 下
命令: cp /opt/software/mysql-connector-java-5.1.46.jar /usr/local/src/hive/lib/
(2)重新启动 hadooop
命令: stop-all.sh
start-all.sh
(3)初始化数据库
命令:schematool -initSchema -dbType mysql
(4)启动hive
命令: hive