步骤一:基础环境和安装准备 Hive 组件需要基于 Hadoop 系统进行安装。因此,在安装 Hive 组件前,需要确保 Hadoop 系统能够正常运行。本章节内容是基于之前已部署完毕的 Hadoop 全分布系统,在 master 节点上实现 Hive 组件安装。 Hive 组件的部署规划和软件包路径如下:
步骤二:解压安装文件,并更名修改目录用户组
(1)当前环境中已安装 Hadoop 全分布系统。
(2)本地安装 MySQL 数据库(账号 root,密码 Password123$), 软件包在/opt/software/mysql-5.7.18 路径下。
(3)MySQL 端口号(3306)。
(4)MySQL 的 JDBC 驱动包/opt/software/mysql-connector-java-5.1.47.jar, 在此基础上更新 Hive 元数据存储。
(5)Hive 软件包/opt/software/apache-hive-2.0.0-bin.tar.gz。
二.设置 Hive 环境
1.卸载 MariaDB 数据库
(1)关闭防火墙服务
(2)设置防火墙服务开机不启动
(3)查询已安装的 mariadb 软件包
(4)卸载 mariadb 软件包
三.安装 MySQL 数据库
( 1)按如下顺序依次按照 MySQL 数据库的 mysql common、mysql libs、mysql client 软件包。
(2)安装 mysql server 软件包。
(3)修改 MySQL 数据库配置,
将以下配置信息添加到/etc/my.cnf 文件 symbolic-links=0 配置信息的下方。
default-storage-engine=innodb
innodb_file_per_table
collation-server=utf8_general_ci
init-connect='SET NAMES utf8'
character-set-server=utf8
(4)启动 MySQL 数据库。
(5)查询 MySQL 数据库状态。mysqld 进程状态为 active (running),则表示 MySQL 数 据库正常运行。
(6)查询 MySQL 数据库默认密码。
(7)MySQL 数据库初始化。
(8)添加 root 用户从本地和远程访问 MySQL 数据库表单的授权。
四.配置 Hive 组件
(1)设置 Hive 环境变量并使其生效
(2)修改 Hive 组件配置文件
(3)通过 vi 编辑器修改 hive-site.xml 文件实现 Hive 连接 MySQL 数据库,并设定 Hive 临时文件存储路径。(文字内容)
1)设置 MySQL 数据库连接。
2)配置 MySQL 数据库 root 的密码。
3)验证元数据存储版本一致性。若默认 false,则不用修改。
4)配置数据库驱动。
5)配置数据库用户名 javax.jdo.option.ConnectionUserName 为 root。
6 )将以下位置的 ${system:java.io.tmpdir}/${system:user.name} 替换为 “/usr/local/src/hive/tmp”目录及其子目录。
五.初始化 hive 元数据
(1)将 MySQL 数据库驱动(/opt/software/mysql-connector-java-5.1.46.jar)拷贝到 Hive 安装目录的 lib 下;
(2)重新启动 hadooop 即可
(3)初始化数据库
(4)启动 hive