一、Hive简介
Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,数据储存在:hdfs上,hsql是由替换简单的mapreduce,hive通过mysql来记录映射数据。
二、环境
jdk可用
hadoop集群可用
mysql可用
三台服务器:master、server1、server2
三、Hive安装
下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-1.2.2/
注:大数据集群对于各版本有较大区别,不建议全使用最新版本,容易出现版本不兼容问题
若安装正确,却不能使用,请查看集群环境的版本兼容
1.解压
tar -zxvf apache-hive-1.2.2-bin.tar.gz
重命名hive
2.配置环境变量
export HIVE_HOME=/usr/hive
export PATH=.:${HIVE_HOME}/bin:$PATH
source /etc/profile
3.进入hive的conf目录
cp hive-default.xml.template hive-site.xml
cp hive-env.sh.template hive-env.sh
cp hive-log4j.properties.template hive-log4j.properties
cp hive-exec-log4j.properties.template hive-exec-log4j.properties
4.创建HDFS目录
启动hadoop-dfs.sh
hadoop fs