1、安装hadoop,参考hadoop伪分布式搭建
https://blog.csdn.net/starkpan/article/details/85470433
2、下载hive,注意hive版本与hadoop一定要一致
wget http://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.7.0.tar.gz
3、解压到指定目录,随你
tar -zxvf hive-1.1.0-cdh5.7.0.tar.gz -C ~/app/
4、配置系统环境变量
vi /etc/profile
export HIVE_HOME=/home/hadoop/app/hive-1.1.0-cdh5.7.0
export PATH=$HIVE_HOME/bin:$PATH
source /etc/profile
安装完成
5、启动hive
hive
6、常用命令与数据库一致
show databases; 展示数据库
create database helloworld;创建数据库helloworld
7、扩展
以上hive已可以正常使用。hive默认使用的是derby数据库进行元数据保存,但是derby有很多不完善的地方,生产上hive采用mysql进行元数据保存,这里需要对hive进行另一个配置。
配置mysql
(1)进入配置文件目录
/home/hadoop/app/hive-1.1.0-cdh5.7.0/conf
(2)复制配置文件
cp hive-env.sh.template hive-env.sh
(3)配置文件中添加配置
vi hive-env.sh
HADOOP_HOME=/home/hadoop/app/hadoop-2.6.0-cdh5.7.0
(4)添加配置模板
vi hive-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/hapark?createDatabaseIfNotExist=true</value>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>root</value>
</property>
</configuration>
(5)引入mysql驱动包,我虚拟机安装的mysql8,所以导入8的驱动包,这个请根据自己版本配置,版本不对,会连接失败。
cp mysql-connector-java-8.0.11.jar ~/app/hive-1.1.0-cdh5.7.0/lib/
(6)启动hive,记得要先启动hadoop与mysql
hive
启动完成后,指定服务器将会看到hive自建的许多表。