使用Hive的HWI接口,可以通过在Web页面上提交HQL查询操作,并浏览查询结果数据。默认情况下,HWI只支持浏览结果数据,不能够下载查询结果文件(当然,HWI可能也是考虑通过Web下载大量的结果数据,对服务器造成压力,或者处于安全方面的考虑)。我们对HWI进行了简单的改造,改造内容主要是增加了一个内置的文件服务器,可以通过页面进行查询,然后下载结果文件。
HWI安装配置
首先,要保证Hadoop集群正常运行,Hive能够正常使用。
先要安装Ant,如下所示:
wget http://mirrors.hust.edu.cn/apache//ant/binaries/apache-ant-1.9.4-bin.tar.gz
tar xvzf apache-ant-1.9.4-bin.tar.gz
ln -s /usr/local/apache-ant-1.9.4-bin /usr/local/ant
修改Hive的环境配置文件hive-env.sh,增加如下配置内容:
export ANT_LIB=/usr/local/ant
将如下JAR文件拷贝到${HIVE_HOME}/lib目录下面:
// 用于编译JSP文件
jasper-compiler-5.5.23.jar
jasper-runtime-5.5.23.jar
// 替换默认的servlet-api-2.5-20081211.jar,我使用的是apache-tomcat-7.0.53/lib下面的s