1、环境配置
1.1、下载https://mirrors.tuna.tsinghua.edu.cn/apache/hive/ (下载hive2.X(支持使用MR、Spark、Tez作为执行引擎)的稳定版2.3.4)
上传到服务器/usr/local/big_data/hive目录下
解压: tar -zxvf apache-hive-2.3.4-bin.tar.gz
重新命名: mv apache-hive-2.3.4-bin ./hive2.3.4
cd /usr/local/big_data/hive/hive2.3.4/conf
修改hive的配置文件: cp hive-default.xml.template ./hive-site.xml
配置hive环境变量:
vim /etc/profile
export HIVE_HOME=/usr/local/big_data/hive/hive2.3.4
export PATH=$PATH:$HIVE_HOME/bin
source /etc/profile 当前脚本当中的一些变量值刷到当前进程中来
2、环境搭建(使用Derby模式,安装hive之前一定要保证Hadoop集群启动正常)
2.1、cd /usr/local/big_data/hive/hive2.3.4目录执行bin/hive (文件保存到hdfs)
hive2.3.4目录下会生成derby.log(日志) metastore_db(元数据库)
在hive2.3.4目录执行bin/hive 创建一个db之后,换到另外一个目录执行hive 后查询db是看不到刚刚建立的db(每个目录执行hive都会产生derby.log和metastore_db所以之前的就看不到),执行source /etc/profile后,show databases又可以看到。
(为什么换了目录又看不到?希望在任何目录都可以看到统一元数据库怎么做?)
2.2、优点:简单使用方便;缺点:管理不方便,数据没法迁移;
备注:内置derby数据库存储metastore时,一个机器只支持一个用户访问(一个访问实例);如果支持多个访问实例需要修改成其他数据库(mysql);
3、环境搭建(使用自定义的Mysql模式)
3.1、安装hive之前一定要保证Hadoop集群启动正常
3.2、hive-site.xml(hive-site.xml.template修改的)配置文件相关配置