前言
- Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
- Hive本质是将SQL转换为MapReduce程序
安装前提
- linux环境(实测windows下hive未安装成功)
- hadoop2.5伪分布式或分布式环境
- hive2.0
- 本文是在namenode的机器上进行hive的安装步骤
第一步下载并解压Hive
第二部配置环境变量
HADOOP_HOME=你的hadoop安装目录
注:因为hive与hadoop的整合过程较老,所以hive还在使用旧的hadoop环境变量。
第三步初始化并启动Hive
- 执行
./schematool -initSchema -dbType derby
来初始化元数据(只需要初始化一次即可)。 - 执行
./hiveserver2
来启动hive。
*注:./hive启动hive方式已经@deprecated*
至此hive已安装完毕,此时可以使用hive自带的beanline来连接一下hive
./beeline -u jdbc:hive2://127.0.0.1:10000/default
之后可以使用类似show databases;
、show tables;
等命令来查看数据库了。而且hive的数据库命令和mysql的命令是很类似的。
全文完。