Hive安装、配置及启动指南

Hive安装、配置及启动指南

Hive简介

Hive是一个基于Hadoop的开源数据仓库工具,用于存储和处理海量结构化数据。由Facebook于2008年开源,Hive提供类似于SQL的HQL语句作为数据访问接口,使传统数据分析人员能够更容易地处理大数据。

使用Hive的原因

  • 类似SQL的查询语法,兼容性好。
  • 以MapReduce(或Spark)为计算引擎,HDFS为存储系统,具备超大数据集的计算和扩展能力。

Hive架构

服务端组件

  • Driver:包括编译、优化和执行,负责解析HiveQL语句。
  • Metastore:元数据服务组件,存储Hive元数据。
  • HiveServer2:支持跨语言服务的开发和权限管理。

客户端组件

  • CLI:命令行接口。
  • JDBC/ODBC:基于HiveServer2的接口。
  • WEBGUI:Hive Web Interface (HWI)。

Hive安装步骤

安装MySQL

  1. 安装wget命令:

    yum -y install wget
    
  2. 下载MySQL的repo源:

    wget http://repo.mysql.com/mysql-community-release-el7-5.noarch.rpm
    
  3. 安装MySQL repo包:

    rpm -ivh mysql-community-release-el7-5.noarch.rpm
    
  4. 安装MySQL服务:

    yum install mysql-server
    
  5. 启动MySQL服务:

    systemctl start mysql.service
    
  6. 使用MySQL设置密码(如果需要):

    set password for root@localhost = password('123456');
    

安装Hive

  1. 解压Hive到指定目录:

    tar -xzvf apache-hive-3.1.3-bin.tar.gz -C /export/servers
    
  2. 配置环境变量,在/etc/profile添加:

    export HIVE_HOME=/export/servers/apache-hive-3.1.3-bin
    export HIVE_CONF_DIR=$HIVE_HOME/conf
    export PATH=$PATH:$HIVE_HOME/bin
    
  3. 使配置生效:

    source /etc/profile
    
  4. 创建hive-site.xml并配置MySQL连接:

    <property>
      <name>javax.jdo.option.ConnectionURL</name>
      <value>jdbc:mysql://localhost:3306/hive_meta?useSSL=false</value>
    </property>
    
  5. 修改Hadoop配置以开启代理功能。

  6. 配置hive-env.sh,指定Hadoop目录。

  7. 重命名日志配置文件。

  8. 在MySQL中创建Hive元数据库hive_meta

  9. 拷贝MySQL驱动到Hive的lib目录。

  10. 删除冲突的log4j库。

  11. 使用schematool初始化MySQL中的Hive元数据。

启动Hive

命令行方式启动Hive

$HIVE_HOME/bin目录下执行:

hive

使用JDBC连接启动HiveServer2

  1. 启动hiveserver2服务:

    hiveserver2
    
  2. 使用beeline连接HiveServer2:

    beeline -u jdbc:hive2://localhost:10000 -n root
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值