1,hive是一个基于hadoop的数据仓库,实质即为一个将MR任务封装为易于编写的hql语句(类似于sql语句)的组件。hive基于hadoop,因此运行hive必须安装hadoop,而hadoop则必须安装jdk。
2,hive作为一个数据仓库,自然需要存储元数据,其内置有一个derby数据库用于存储元数据,但使用derby作为元数据库时只允许单用户单会话连接,生产实用时过于受限,因此常使用mysql作为其元数据库,可以做到多用户多会话连接。
因此,安装hive的前提是:jdk、hadoop、mysql
开始安装
一:启动Hadoop,传入hive压缩包,解压并更改文件名
1,启动hadoop:
[root@hadoop ~]# start-all.sh
2,传入压缩包
3,解压并更改文件名
[root@hadoop install]# tar -zxvf apache-hive-3.1.2-bin.tar