Ubuntu16安装HIVE全程记录


title: Ubuntu16安装HIVE全程记录
date: 2019-09-04 20:57:00
categories:

  • 技术
    tags:
  • Hive

为了方便的使用hdfs,我安装个hive,记录如下。

什么是 Hive

  • Hive 由 Facebook 实现并开源,是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据映射为一张数据库表,并提供 HQL(Hive SQL)查询功能,底层数据是存储在 HDFS 上。
  • Hive 本质: 将 SQL 语句转换为 MapReduce 任务运行,使不熟悉 MapReduce 的用户很方便地利用 HQL 处理和计算 HDFS 上的结构化的数据,是一款基于 HDFS 的 MapReduce 计算框架
  • 主要用途:用来做离线数据分析,比直接用 MapReduce 开发效率更高。但是运行还是一样的慢~

安装-数据获取

wget https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-3.1.2/apache-hive-3.1.2-bin.tar.gz

然后解压

tar -zxvf apache-hive-3.1.2-bin.tar.gz 

image-20190904154919744

安装-配置

  1. hive conf 配置

    进入到 解压后的hive目录 找到 conf目录, 修改配置文件

    cp hive-env.sh.template hive-env.sh
    vi hive-env.sh
    

    在hive-env.sh中指定hadoop的路径

    HADOOP_HOME=/home/parallels/app/hadoop-3.1.2
    

    image-20190904155205013

    在系统环境变量里添加(我的是在 ~/.bashrc) 并 source该文件,使其生效。

    export HIVE_HOME=/home/hadoop/app/hive-1.1.0-cdh5.7.0
    export PATH=$HIVE_HOME/bin:$PATH
    
  2. 数据库参数配置

    1. 配置日志(不管有没有问题,先把日志配上,不然后面不好定位问题)

      $ cp hive-log4j2.properties.template hive-log4j2.properties
      $ vi hive-log4j2.properties
      
      配置property.hive.log.dir
      property.hive.log.dir =/opt/hive/apache-hive-3.1.1/logs 
      ##注意:logs需要自己创建,在hive目录下mkdir logs)
      
    2. 配置hive-site.xml

      配置与mysql的连接。包括 MySql用户、密码、连接地址、驱动。

      其中驱动需要下载、解压jar至hive目录的lib下。

      下载驱动。解压后放入lib目录下

      wget https://mirrors.tuna.tsinghua.edu.cn/mysql/downloads/Connector-J/mysql-connector-java-5.1.48.tar.gz
      

      下面配置连接信息。

      cp hive-default.xml.template   hive-site.xml
      

      找到以下节点并修改

          <property>
              <name>javax.jdo.option.ConnectionUserName</name>
              <value>hive</value><!-- 指定mysql用户名 -->
          </property>
          <property>
              <name>javax.jdo.option.ConnectionPassword</name>
              <value>hive</value><!-- 指定mysql密码 -->
          </property>
         <property>
              <name>javax.jdo.option.ConnectionURL</name>
              <value>jdbc:mysql://127.0.0.1:3306/hive</value>
          </property><!-- 指定mysql数据库地址 -->
          <property>
              <name>javax.jdo.option.ConnectionDriverName</name>
              <value>com.mysql.jdbc.Driver</value><!-- 指定mysql驱动 -->
          </property>
      

      在最前面添加以下2个节点,其中system:java.io.tmpdir对应的value值是你自己建立目录的路径。

       <property>
            <name>system:java.io.tmpdir</name>
            <value>你自己建立的目录</value>
       </property>
       <property>
            <name>system:user.name</name>
            <value>${user.name}</value>
       </property>
      

      hive.metastore.schema.verification value值改为false

  3. mySql中的Hive需要初始化

    该操作是初始化hive数据库中的与元数据相关的表。不要忘记!

    schematool -dbType mysql -initSchema
    

启动

首先,执行hive --service metastore 启动Thrift服务端

hive --service metastore

然后执行hive命令

hive

image-20190904212215830

如果没有得到你想要的结果,请在你配置的property.hive.log.dir路径下查看日志,比上网查找原因有用多了,因为配置项比较多,每个人的原因不尽相同。

比如我,进入hive后,在show databases; 总是提示:Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient,后面经过排查是没有初始化mysql的元数据信息。同时,网上因版本问题,配置的方法可能并不适用,自己多看日志多思考。

其他

ubuntu16.04中开启和关闭防火墙

  1. 开启防火墙

    ufw enable

  2. 关闭防火墙

    ufw disable

参考&致谢

https://blog.csdn.net/weixin_44105991/article/details/97780778

https://blog.csdn.net/zhangvalue/article/details/84282827

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要在 Ubuntu 20.04 上安装 Hive,您可以按照以下步骤进行操作: 1. 安装 Java Development Kit(JDK): ``` sudo apt update sudo apt install default-jdk ``` 2. 下载和解压 Hive: ``` wget https://downloads.apache.org/hive/hive-3.1.2/apache-hive-3.1.2-bin.tar.gz tar xf apache-hive-3.1.2-bin.tar.gz sudo mv apache-hive-3.1.2-bin /opt/hive ``` 3. 配置环境变量: 打开 `~/.bashrc` 文件: ``` nano ~/.bashrc ``` 在文件末尾添加以下内容: ``` export HIVE_HOME=/opt/hive export PATH=$PATH:$HIVE_HOME/bin ``` 保存并关闭文件,然后执行以下命令使更改生效: ``` source ~/.bashrc ``` 4. 配置 Hive: 将 `hive-default.xml.template` 文件复制为 `hive-site.xml`: ``` cp /opt/hive/conf/hive-default.xml.template /opt/hive/conf/hive-site.xml ``` 5. 配置 MySQL 数据库(用于元数据库): 安装 MySQL 服务器: ``` sudo apt install mysql-server ``` 登录到 MySQL 控制台并创建一个新的数据库和用户: ``` sudo mysql CREATE DATABASE metastore; CREATE USER 'hiveuser'@'localhost' IDENTIFIED BY 'your_password'; GRANT ALL PRIVILEGES ON metastore.* TO 'hiveuser'@'localhost'; FLUSH PRIVILEGES; EXIT; ``` 接下来,编辑 `hive-site.xml` 文件: ``` sudo nano /opt/hive/conf/hive-site.xml ``` 找到以下行: ```xml <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://localhost/metastore?createDatabaseIfNotExist=true</value> ... </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>hiveuser</value> ... </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>your_password</value> ... </property> ``` 将 `your_password` 替换为您在上一步中设置的密码。 6. 启动 Hive Metastore 服务: ``` schematool -dbType mysql -initSchema # 这将初始化元数据库 hiveserver2 # 启动 Hive 服务 ``` 现在,您已经成功安装并配置了 Hive。您可以使用 Hive 查询和管理大规模数据集。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值