ubuntu上基于HUE 4.0的环境构建和使用

最新推荐文章于 2024-08-01 06:30:00 发布

Heavbird

最新推荐文章于 2024-08-01 06:30:00 发布

阅读量2.1k

点赞数 1

分类专栏：大数据文章标签： Hadoop HUE Hbase Oozie Spark

本文链接：https://blog.csdn.net/wqhlmark64/article/details/78416374

版权

本文介绍了如何在Ubuntu上构建和使用HUE 4.0环境，包括HUE的用途、下载安装、配置过程，特别强调了HDFS、Hive、Spark、Hbase等组件的配置细节，以及遇到端口冲突等问题时的解决方法。通过这个指南，读者可以了解如何在已有的Hadoop集群上集成和使用HUE。

摘要由CSDN通过智能技术生成

先看下HUE的架构，如图

1. Hue是什么？

Hue是一个可快速开发和调试Hadoop生态系统各种应用的一个基于浏览器的图形化用户接口。

2. Hue能干什么？

访问HDFS和文件浏览
通过web调试和开发hive以及数据结果展示
查询solr和结果展示，报表生成
通过web调试和开发impala交互式SQL Query
spark调试和开发
Pig开发和调试
oozie任务的开发，监控，和工作流协调调度
Hbase数据查询和修改，数据展示
Hive的元数据（metastore）查询
MapReduce任务进度查看，日志追踪
创建和提交MapReduce，Streaming，Java job任务
Sqoop2的开发和调试
Zookeeper的浏览和编辑
数据库（MySQL，PostGres，SQlite，Oracle）的查询和展示

3. Hue怎么用或者什么时候应该用？

如果你们公司用的是CDH的hadoop，那么很幸运，Hue也是出自CDH公司，自家的东西用起来当然很爽。
如果你们公司用的是Apache Hadoop或者是HDP的hadoop，那么也没事，Hue是开源的，而且支持任何版本的hadoop。

关于什么时候用，这纯属一个锦上添花的功能，你完全可以不用hue，因为各种开源项目都有自己的使用方式和开发接口， hue只不过是统一了各个项目的开发方式在一个接口里而已，这样比较方便而已，不用你一会准备使用hive，就开一个hive的cli终端，一会用pig，你就得开一个pig的grunt，或者你又想查Hbase，又得需要开一个Hbase的shell终端。如果你们使用hadoop生态系统的组件很多的情况下，使用hue还是比较方便的，另外一个好处就是hue提供了一个web的界面来开发和调试任务，不用我们再频繁登陆Linux来操作了。

你可以在任何时候，只要能上网，就可以通过hue来开发和调试数据，不用再装Linux的客户端来远程登陆操作了，这也是B/S架构的好处。