1.hue简介
1.1什么是hue?
HUE=Hadoop User Experience
Hue是一个开源的Apache hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。
通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job,执行Hive的SQL语句,浏览Hbase数据库等等。
1.2.hue的链接
- 官网:http://gethue.com/
- Github: https://github.com/cloudera/hue
- Reviews: https://review.cloudera.org
1.3hue的架构
1.4核心功能
- SQL编辑器,支持Hive, Impala, MySQL, Oracle, PostgreSQL, SparkSQL, Solr SQL, Phoenix…
- 搜索引擎Solr的各种图表
- Spark和Hadoop的友好界面支持
- 支持调度系统Apache Oozie,可进行workflow的编辑、查看
- 将数据导入hdfs
- 浏览器查看状态,支持 YARN, HDFS, Hive table Metastore, HBase, ZooKeeper
HUE提供的这些功能相比Hadoop生态各组件提供的界面更加友好,但是一些需要debug的场景可能还是需要使用原生系统才能更加深入的找到错误的原因。
HUE中查看Oozie workflow时,也可以很方便的看到整个workflow的DAG图,不过在最新版本中已经将DAG图去掉了,只能看到workflow中的action列表和他们之间的跳转关系,想要看DAG图的仍然可以使用oozie原生的界面系统查看。
1.5hue的特性
- 图形化交互程序:节约学习成本
- 多应用同平台,便捷的操作流程
- 提示、自动补全功能
- 查询结果表格化、图形化显示、结果记忆功能
- 不同用户定制化服务
2.hue的安装
2.1运行环境
虚拟机:centos7
安装软件:
hadoop-2.7.3
hive-2.3.0
jdk1.8+
hue-4.0.1
MySQL数据库
2.2安装hadoop集群、hive
安装hadoop伪分布式:http://blog.csdn.net/qq_38799155/article/details/77748831
安装hive:http://blog.csdn.net/qq_38799155/article/details/77605615
2.3下载、安装hue
在root用户下安装wget
# yum -y insta