为了减少冲突,一般来说版本都用统一的比较好,所以选择CDH的部署。
前面的hadoop是选择hadoop-2.6.0-cdh5.7.0 ,所以hive安装的版本跟hadooop的尾巴对准了。
1、打开http://archive-primary.cloudera.com/cdh5/cdh/5/
2、ctrl+F 搜 hive-1.1.0-cdh5.7.0 , 右键选择并点击 hive-1.1.0-cdh5.7.0.tar.gz,复制链接地址
3、下载和解压
用wget开始下载,下载到app目录,下载的速度有点慢,可以问朋友或同学共享一下。
wget http://archive-primary.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.7.0.tar.gz
下载好,就可以解压了,tar xzvf hive-1.1.0-cdh5.7.0.tar.gz 解压到当前目录。即app目录
顺便熟悉一下解压后的hive的各个目录结构
bin--存放脚本的;conf--存放配置文件的;lib--存放依赖包
4、配置环境变量
配置个人环境变量 ~/.bash_profile, 在里面添加
export HIVE_HOME=/home/hadoop/app/hive-1.1.0-cdh5.7.0
和 export PATH=$HIVE_HOME/bin:$PATH ,然后source ~/.bash_profile 生效一下, 可以用 echo $HIVE_HOME 看看
5、配置hive-env.sh
进conf目录,一开始是没有hive-env.sh这个文件的,需要拷贝hive-env.sh.template并改名成hive-env.sh
在里面添加
HADOOP_HOME=/home/hadoop/app/hadoop-2.6.0-cdh5.7.0
6、在conf添加hive-site.xml,本来是没有这个文件的,需要另外添加hive-site.xml的,hive-site.xml配置的其实就是MySQL的相关信息,具体内容如下
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/ruoze_d5?createDatabaseIfNotExist=true&characterEncoding=UTF-8</value>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value> # 这个是连接数据库的用户名,要根据自己的情况修改
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>root</value> #这个是登录数据库密码,要根据自己的情况更改,本人的密码是123456,所以这个root 就要改了。
</property>
<property>
<name>hive.cli.print.current.db</name>
<value>true</value>
</property>
</configuration>
7、既然要连mysql, 所以要拷贝mysql驱动到$HIVE_HOME/lib
8、启动hdfs和yarn。既然要启动hive,就要把hdfs、yarn先启动起来。
hdfs的三个进程NN、DN、SNN,yarn的两个进程NM、RM
9、启动hive。
10、打开mysql,用show databases 查看一下之前创建的ruoze_d5数据库是否可以查出来,看到已经有了。
user ruoze_d5 切换到该数据库。用show tables; 看看有什么表,看下图,里面的哪些表就是所谓的meta信息。
到此。Hive部署完毕。