Hue是一个开源的Apache Hadoop UI系统。
• 通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交 互来分析处理数据。
– 例如操作HDFS上的数据、运行Hive脚本、管理Oozie任务等等。
• 是基于Python Web框架Django实现的。 • 支持任何版本Hadoop
– 基于文件浏览器(File Browser)访问HDFS
– 基于web编辑器来开发和运行Hive查询
– 支持基于Solr进行搜索的应用,并提供可视化的数据视图,报表生成 – 通过web调试和开发impala交互式查询
– spark调试和开发
– Pig开发和调试
– oozie任务的开发,监控,和工作流协调调度
– Hbase数据查询和修改,数据展示
– Hive的元数据(metastore)查询
– MapReduce任务进度查看,日志追踪
– 创建和提交MapReduce,Streaming,Java job任务
– Sqoop2的开发和调试
– Zookeeper的浏览和编辑
– 数据库(MySQL,PostGres,SQlite,Oracle)的查询和展示
安装hue依赖的第三方包
#安装xml软件包
$>sudo yum install -y libxml2-devel.x86_64
#安装其他软件包
$>sudo yum install -y libxslt-devel.x86_64 python-devel openldap-devel asciidoc cyrus-sasl-gssapi
配置hue
hue与hadoop连接,即访问hadoop文件,可以使用两种方式。
-
WebHDFS
提供高速数据传输,client可以直接和DataNode通信。
-
HttpFS
一个代理服务,方便于集群外部的系统进行集成。注意:HA模式下只能使用该中方式。
3.1 配置hadoop的hue代理用户
-
[/soft/hadoop/etc/hadoop/core-site.xml]
注意:hadoop的代理用户配置方式是:hadoop.proxyuser.${superuser}.hosts,这里我的superuser是centos。
<property>
<name>hadoop.proxyuser.centos.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.centos.groups</name>
<value>*</value>
</property>
-
[/soft/hadoop/etc/hadoop/hdfs-site.xml]
<property> <name>dfs.webhdfs.enabled</name> <value>true</value> </property>
-
[/soft/hadoop/etc/hadoop/httpfs-site.xml]