基于阿里云服务器搭建完全分布式Hadoop集群+Hive仓库+Spark集群(三)

写在前面的话

本文为搭建完全分布式的大数据集群第三弹,在第一篇的基础上,讲解如何搭建Hive仓库。

欢迎扫码关注我的公众号,与我一同学习进步!主要致力于学习

  1. 使用深度学习解决计算机视觉相关问题
  2. Python为主的互联网应用服务
  3. 基于MIPS指令集的CPU微体系结构设计
    在这里插入图片描述

与Hadoop集群以及Spark集群不同的是,数据仓库Hive并不需要在每一台主机上都进行搭建,只需要在主节点的主机上进行搭建即可。因此,本文的以下操作均针对主服务器。

安装MySQL

  1. 使用命令sudo apt-get install mysql-server-5.7安装MySQL的客户端和服务端

  2. 使用命令sudo apt install libmysqlclient-dev安装MySQL需要的依赖

  3. 使用命令查看ps -e | grep mysql可以发现,MySQL的进程已经启动

安装Hive

为了确保版本之间的适配性,选择版本为2.3.7的Hive数据仓库进行安装;

为了确保目录的一致性,仍然选择安装在/usr/local/目录下

  1. 使用命令cd /usr/local/直接切换到目标目录下

  2. 使用命令wget https://pengkai.online/hive-2.3.7-bin.tar.gz下载Hive-2.3.7

  3. 使用命令tar -zxvf hive-2.3.7-bin.tar.gz解压Hive的压缩包

  4. 配置环境变量

    使用命令vim /etc/profile打开配置文件,配置Hive的环境变量,将以下内容添加到文件末尾,保存并退出。

    # hive
    export HIVE_HOME=/usr/local/hive-2.3.7
    export CLASSPATH=.:${HIVE_HOME}/lib:$CLASSPATH
    export PATH=${HIVE_HOME}/bin:${HIVE_HOME}/conf:$PATH
    

    **注:**如果你的目录不是/usr/local,一定要更改为自己的目录。

  5. 使用命令source /etc/profile激活配置的环境变量

  6. 使用命令hive --version查看Hive的版本,出现如下图所示的结果即表示安装成功

配置Hive

  1. 使用命令cd /usr/local/hive-2.7.3/conf切换到配置文件的目录下

  2. 配置hive-site.xml文件

    使用命令vim ./hive-site.sml打开配置文件,并进行如下的配置

    将下面的内容粘贴到configuration标签之间

    	<!-- 设置JDBC与MySQL之间的连接 -->
    	<property>
        	<name>javax.jdo.option.ConnectionURL</name>
        	<value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true&amp;characterEncoding=latin1&amp;useSSL=false</value>
        	<description>JDBC connect string for a JDBC metastore</description>
      	</property>
      	
      	<!-- 设置驱动 -->
      	<property>
        	<name>javax.jdo.option.ConnectionDriverName</name>
        	<value>com.mysql.jdbc.Driver</value>
        	<description>Driver class name for a JDBC metastore</description>
      	</property>
      	
      	<!-- 设置MySQL连接的用户名,可以根据自己的需要进行更改 -->
      	<property>
        	<name>javax.jdo.option.ConnectionUserName</name>
        	<value>hive</value>
        	<description>username to use against metastore database</description>
      	</property>
      	
      	<!-- 设置MySQL连接的密码,可以根据自己的需要进行更改 -->
        <property>
            <name>javax.jdo.option.ConnectionPassword</name>
            <value>hive</value>
            <description>password to use against metastore database</description>
        </property>
    
  3. 配置MySQL、Java与Hive三者进行通信的时候需要的jar包

    使用命令cd /usr/local/hive-2.3.7/lib切换到Hive中存放jar包的位置

    使用命令wget http://downloads.mysql.com/archives/mysql-connector-java-5.0/mysql-connector-java-5.0.8.tar.gz下载需要的jar包

    使用命令tar -zxvf mysql-connector-java-5.0.8.tar.gz解压需要的jar包

  4. 初始化元数据库

    以上配置均进行完成后,使用命令schematool -dbType mysql -initSchema初始化元数据库

启动Hive

启动Hive之前,应该确保Hadoop与MySQL均已启动

在shell终端中,直接输入命令hive即可进入Hive的shell界面,如下图所示

至此,Hive已经可以正常工作,使用命令quit;即可退出Hive的shell界面。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值