Hadoop渐进八:Hive配置

一、Hive简述

Hive:基于Hadoop文件系统上的数据仓库架构。Hive提供了一系列工具用于数据提取、转化、加载,它是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive还定义了类SQL语言—Hive QL,Hive QL允许用户进行SQL相似的操作。

二、Hive配置:基于Mysql

默认情况下,Hive metadata数据保存在内嵌的Derby数据库,只能实现一个会话连接,一般适合于简单测试。但为了支持多用户多会话功能,我们使用MySQL作为元数据库,Hive内部也对MySQL提供了很好的支持。

1、配置mysql:

sudo apt-get install mysql-server          //Mysql server 

sudo apt-get install mysql-client           //Mysql client

sudo apt-get install libmysqlclient-dev  //Mysql dev

sudo netstat -tap | grep mysql              //Is it success?

sudo mysql -u root -p                           //Login mysql

……

另外,在Hive安装成功运行的情况下,可以查看MySQL数据库中的一部分Hive元数据格式: 


2、创建hive用户,并赋予相应权限

mysql -r root -p

mysql> create user ‘hive’ identified by ‘hive’;

mysql> grant all privileges on *.* to ‘hive’ with grant option;

mysql> flush privileges;

……

3、hive下载配置

下载hive:http://apache.fayea.com/hive/hive-1.2.2/

解压hive到:/usr/hadoop/

重命名hive:hive-1.2.2

下载Mysql connector java:https://dev.mysql.com/downloads/connector/j/

解压Mysql connector java到:/usr/hadoop/hive-1.2.2/lib

4、hive环境变量

sudo vim ~/.bashrc 


其中:/usr/hadoop/hive-1.2.2为hive安装目录

5、hive conf配置

(1)、hive-site.xml:若无这个文件,新建一个就好,配置如下: 


hive.metastore.warehouse.dir:Hive在HDFS上数据目录

hive.exec.scratchdir:Hive在HDFS上临时目录

javax.jdo.option.ConnectionURL:元数据连接字串

java.jdo.option.ConnectionDriverName:DB连接引擎

(2)、配置hive环境文件hive-env.sh:sudo cp hive-env.sh.template hive-env.sh

(3)、配置hive日志文件hive-log4j.properties:sudo cp hive-log4j.properties.template hive-log4j.properties

7、在hadoop分布式集群正常运行的情况下

$sudo start-all.sh

$schematool -initSchema -dbType mysql //初始化元数据

$hive

hive> show tables 


如出现错误:org.apache.hadoop.hive.metastore.HiveMetaException:Failed to load driver,则可能是缺少JDBC驱动,添加mysql-connectot-java-5.1.42-bin.jar

8、hive的web配置(HWI是Hive Web Interface的简称,是hive cli的一个web替换方案)

(1)、安装ANT:sudo apt-get install ant

(2)、官网下载hive对应版本(我这里是1.2.2)的src文件,解压进入src文件下src/hwi,使用命令将web打包成war格式压缩包:

tar -zxvf hive-1.2.2-src.tar.gz

cd hive-1.2.2-src/hwi

jar cfM hive-hwi-1.2.2.war -C web ./

(3)、将*.war压缩包拷贝到/usr/hadoop/hive-1.2.2/lib目录下(我的hive安装目录)

(4)、配置hive.site.xml,如下: 


(5)、启动hwi服务:hive --service hwi

若出现错误:NO JSP Support for /hwi, did not find org.apache.jasper.servlet.JspServlet

—>拷贝jdk/lib/tools.jar到/hive-1.2.2/lib

—>拷贝hbase/lib/jasper-compiler-5.5.23.jar到/hive-1.2.2/lib

—>拷贝hbase/lib/jasper-runtime-5.5.23.jar到/hive-1.2.2/lib

—>拷贝hbase/lib/common-el-1.0.jar

注:首先在系统中查找*.jar,找不到的情况下才去网上下载

(6)、在浏览器输入:http://192.168.0.100:9999/hwi 


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值