What?
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。
可以将sql语句直接转换成MapReduce任务的一个工具
Why?
其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。
How?
安装:
1、上传安装文件到/opt目录
2、解压安装文件
tar -zxvf apache-hive-1.2.2-bin.tar.gz -C /opt/
3、配置环境变量(/etc/profile)
vim /etc/profile
export HIVE_HOME=/opt/hive-1.2.2
export PATH=$HIVE_HOME/bin:
source /etc/profile 是当前配置文件立即生效