cdh5.3.6下hue3.7.0的安装部署

由于在CM5.7.0中执行HUE的hive workflow有问题,网上说是oozie仅支持0.13.1版本的hive,故搭建的集群暂时用不上,需要重新搭建一个伪分布式的cm,网上找到一篇,在下载下面的组件的时候,确实是有些版本限制,按下文走一遭试试!

帮的上忙的链接:http://suncf1985.iteye.com/blog/2012926!!!

本文介绍如何在centOS6.4环境下安装hue环境!

一、安装环境列表

centOS6.4

hue-3.7.0-cdh5.3.6

cdh5.3.6

jdk1.7.0_67

hadoop2.5.0

hive-0.13.1-cdh5.3.6

oozie-4.0.0-cdh5.3.6

下载地址:http://archive.cloudera.com/cdh5/cdh/5/

二、安装编译

    2.1 解压hue-3.7.0-cdh5.3.6

将上一步下载好的hue-3.7.0-cdh5.3.6解压到某一目录(如:/home/xusy/share/cdh5.3.6)


2.2 安装依赖包

sudo yum install ant asciidoc cyrus-sasl-devel cyrus-sasl-gssapi gcc gcc-c++ krb5-devel libtidy libxml2-devel libxslt-devel make mvn mysql mysql-devel openldap-devel python-devel sqlite-devel openssl-devel gmp-devel


P
S:安装依赖包之前,最好使用国内仓库,下载速度快些,而且也相对稳定。

     可以参考文章:http://blog.csdn.net/maomaosi2009/article/details/45646245


2.3 编译hue

make apps

编译完成后,如果多了以下两个文件,就证明已经编译成功,如果编译失败了,请检查上一步安装的依赖包有没      有失败的。


3、配置文件

在目录/home/xusy/share/cdh5.3.6/hue-3.7.0-cdh5.3.6/desktop/conf下有个hue.ini文件

修改如下地方:

  1. # Set this to a random string, the longer the better.  
  2. # This is used for secure hashing in the session store.  
  3. secret_key=jFE93j;2maomaosi22943d['d;/.q[eIW^y#e=+Iei*@  
  4.   
  5. # Webserver listens on this address and port  
  6. http_host=xuxudede.com  
  7. http_port=8888  
  8.   
  9. # Time zone name  
  10. time_zone=Asia/Shanghai  

注意:secret_key随便填写一个30-60个长度的字符串即可,如果不填写的话Hue会提示错误信息,这个secret_key主要是出于安全考虑用来存储在session store中进行安全验证的。时区修改成亚洲时区。

4、启动hue

build/env/bin/supervisor



注意:这个进程不能关掉,可以在后台启动。

     启动成功后,查看http://xuxudede.com:8888/网页显示

输入用户名密码后


至此,hue已经安装成功,就可以在上面集成hadoop、hive等了。

======================================================================================================

修改/hue/desktop/conf/hue.ini

hadoop_home等信息

注意端口号是否与hadoop上一致

例如默认hdfs_port=8020, 实际上hadoop上配置的为9000


运行hue

/usr/share/hue/build/env/bin/superviser
报错

  1. [root@localhost lib]# /usr/share/hue/build/env/bin/supervisor  
  2. Traceback (most recent call last):  
  3.   File "/usr/share/hue/build/env/bin/supervisor", line 8, in <module>  
  4.     load_entry_point('desktop==3.5.0', 'console_scripts', 'supervisor')()  
  5.   File "/usr/share/hue/desktop/core/src/desktop/supervisor.py", line 319, in main  
  6.     setup_user_info()  
  7.   File "/usr/share/hue/desktop/core/src/desktop/supervisor.py", line 257, in setup_user_info  
  8.     desktop.lib.daemon_utils.get_uid_gid(SETUID_USER, SETGID_GROUP)  
  9.   File "/usr/share/hue/desktop/core/src/desktop/lib/daemon_utils.py", line 45, in get_uid_gid  
  10.     raise KeyError("Couldn't get user id for user %s" % (username,))  
  11. KeyError: "Couldn't get user id for user hue"  


参考 https://github.com/cloudera/hue/issues/27   

adduser hue

  1. [root@localhost lib]# adduser hue  
  2. [root@localhost lib]# /usr/share/hue/build/env/bin/supervisor 又报错  
  3. /usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/conf/__init__.py:110: DeprecationWarning: The SECRET_KEY setting must not be empty.  
  4.   warnings.warn("The SECRET_KEY setting must not be empty.", DeprecationWarning)  
  5. /usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/conf/__init__.py:110: DeprecationWarning: The SECRET_KEY setting must not be empty.  
  6.   warnings.warn("The SECRET_KEY setting must not be empty.", DeprecationWarning)  
  7. /usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/conf/__init__.py:110: DeprecationWarning: The SECRET_KEY setting must not be empty.  
  8.   warnings.warn("The SECRET_KEY setting must not be empty.", DeprecationWarning)  
  9. starting server with options {'ssl_certificate': None, 'workdir': None, 'server_name': 'localhost', 'host': '0.0.0.0', 'daemonize': False, 'threads': 10, 'pidfile': None, 'ssl_private_key': None, 'server_group': 'hue', 'ssl_cipher_list': 'DEFAULT:!aNULL:!eNULL:!LOW:!EXPORT:!SSLv2', 'port': 8888, 'server_user': 'hue'}  



The SECRET_KEY setting must not be empty

Specifying the Secret Key

For security, you should also specify the secret key that is used for secure hashing in the session store. Enter a long series of random characters (30 to 60 characters is recommended).

secret_key=jFE93j;2[290-eiw.KEiwN2s3['d;/.q[eIW^y#e=+Iei*@Mn<qW5o
[Note]  

If you don’t specify a secret key, your session cookies will not be secure. Hue will run but it will also display error messages telling you to set the secret key.



完善各种配置

在core-site.xml 配置


<property>
  <name>hadoop.tmp.dir</name>
  <value>/tmp/hadoop-${user.name}${hue.suffix}</value>
</property>

由于已经安装hive需在hue.ini中指定变量

  # Hive configuration directory, where hive-site.xml is located
  ## hive_conf_dir=/etc/hive/conf
hive_conf_dir=/opt/hadoop/hive-0.10.0-bin/conf

启动  /usr/share/hue/build/env/bin/supervisor
command line里显示正常
  1. [root@localhost desktop]# /usr/share/hue/build/env/bin/supervisor  
  2. starting server with options {'ssl_certificate': None, 'workdir': None, 'server_name': 'localhost', 'host': '127.0.0.1', 'daemonize': False, 'threads': 10, 'pidfile': None, 'ssl_private_key': None, 'server_group': 'hue', 'ssl_cipher_list': 'DEFAULT:!aNULL:!eNULL:!LOW:!EXPORT:!SSLv2', 'port': 8888, 'server_user': 'hue'}  
  3. /usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/views/generic/simple.py:8: DeprecationWarning: Function-based generic views have been deprecated; use class-based views instead.  
  4.   DeprecationWarning  


但是http://localhost:8888/accounts/login/?next=/ 进入出现报错信息

  1. [25/Feb/2014 01:32:08 +0000] middleware   INFO     Redirecting to login page: /  
  2. [25/Feb/2014 01:32:08 +0000] access       INFO     127.0.0.1 -anon- - "GET / HTTP/1.1" -- login redirection  
  3. [25/Feb/2014 01:32:09 +0000] base         ERROR    Internal Server Error: /accounts/login/  
  4. Traceback (most recent call last):  
  5.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/core/handlers/base.py", line 188, in get_response  
  6.     response = middleware_method(request, response)  
  7.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/contrib/sessions/middleware.py", line 36, in process_response  
  8.     request.session.save()  
  9.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/contrib/sessions/backends/db.py", line 58, in save  
  10.     obj.save(force_insert=must_create, using=using)  
  11.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/db/models/base.py", line 463, in save  
  12.     self.save_base(using=using, force_insert=force_insert, force_update=force_update)  
  13.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/db/models/base.py", line 551, in save_base  
  14.     result = manager._insert([self], fields=fields, return_id=update_pk, using=using, raw=raw)  
  15.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/db/models/manager.py", line 203, in _insert  
  16.     return insert_query(self.model, objs, fields, **kwargs)  
  17.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/db/models/query.py", line 1593, in insert_query  
  18.     return query.get_compiler(using=using).execute_sql(return_id)  
  19.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/db/models/sql/compiler.py", line 912, in execute_sql  
  20.     cursor.execute(sql, params)  
  21.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/db/backends/sqlite3/base.py", line 344, in execute  
  22.     return Database.Cursor.execute(self, query, params)  
  23. DatabaseError: attempt to write a readonly database  

原因是 /usr/share/hue/desktop/desktop.db  对root用户权限777但对其它用户:hue只有读的权限

chmod o+w desktop.db

又报错

  1. [25/Feb/2014 01:33:26 +0000] base         ERROR    Internal Server Error: /accounts/login/  
  2. Traceback (most recent call last):  
  3.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/core/handlers/base.py", line 188, in get_response  
  4.     response = middleware_method(request, response)  
  5.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/contrib/sessions/middleware.py", line 36, in process_response  
  6.     request.session.save()  
  7.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/contrib/sessions/backends/db.py", line 58, in save  
  8.     obj.save(force_insert=must_create, using=using)  
  9.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/db/models/base.py", line 463, in save  
  10.     self.save_base(using=using, force_insert=force_insert, force_update=force_update)  
  11.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/db/models/base.py", line 551, in save_base  
  12.     result = manager._insert([self], fields=fields, return_id=update_pk, using=using, raw=raw)  
  13.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/db/models/manager.py", line 203, in _insert  
  14.     return insert_query(self.model, objs, fields, **kwargs)  
  15.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/db/models/query.py", line 1593, in insert_query  
  16.     return query.get_compiler(using=using).execute_sql(return_id)  
  17.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/db/models/sql/compiler.py", line 912, in execute_sql  
  18.     cursor.execute(sql, params)  
  19.   File "/usr/share/hue/build/env/lib/python2.6/site-packages/Django-1.4.5-py2.6.egg/django/db/backends/sqlite3/base.py", line 344, in execute  
  20.     return Database.Cursor.execute(self, query, params)  
  21. DatabaseError: unable to open database file  

原因是包含desktop.db的文件夹对hue用户也是只能读不能写的

干脆把这个hue文件所属用户和组都给hue

chown chown -R hue.hue /usr/share/hue

再启动 完美运行 


注意:

若提示

Resource Manager Failed to contact Resource Manager at http://localhost:8088/ws/v1:。。。

原因是 hue.ini 中同时配置了 [[yarn_clusters]] 和 [[mapred_clusters]] 中的 

  # Whether to submit jobs to this cluster
      submit_to=true

两者只能选一,MR1就选后者MR2选 [[yarn_clusters]]


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
### 回答1: CDH6.3中Hue的配置可以通过以下步骤完成: 1. 安装CDH6.3集群,并在其中一台机器上安装Hue。 2. 配置Hue的数据库连接,可以选择MySQL作为Hue的元数据存储和用户认证数据库。在Hue的配置文件中,设置以下参数: ``` [desktop] ... # Database settings ... engine=django.db.backends.mysql host=<MySQL服务器IP地址> port=<MySQL服务器端口> user=<MySQL用户名> password=<MySQL用户密码> name=<MySQL数据库名> ``` 3. 配置Hive的连接,可以通过以下步骤完成: (1)在Hue的配置文件中,设置以下参数: ``` [hadoop] ... # Hive settings ... hive_server_host=<Hive服务器IP地址> hive_server_port=<Hive服务器端口> ``` (2)在Hive的配置文件中,设置以下参数: ``` <property> <name>hive.server2.enable.doAs</name> <value>true</value> </property> <property> <name>hive.server2.authentication</name> <value>KERBEROS</value> </property> <property> <name>hive.server2.authentication.kerberos.principal</name> <value>hive/_HOST@<Kerberos域名></value> </property> <property> <name>hive.server2.authentication.kerberos.keytab</name> <value>/etc/security/keytabs/hive.service.keytab</value> </property> ``` 4. 配置HBase的连接,可以通过以下步骤完成: (1)在Hue的配置文件中,设置以下参数: ``` [hbase] ... # HBase settings ... hbase_host=<HBase服务器IP地址> hbase_port=<HBase服务器端口> ``` (2)在HBase的配置文件中,设置以下参数: ``` <property> <name>hbase.security.authentication</name> <value>kerberos</value> </property> <property> <name>hbase.security.authorization</name> <value>true</value> </property> <property> <name>hbase.rpc.engine</name> <value>org.apache.hadoop.hbase.ipc.SecureRpcEngine</value> </property> <property> <name>hbase.master.kerberos.principal</name> <value>hbase/_HOST@<Kerberos域名></value> </property> <property> <name>hbase.regionserver.kerberos.principal</name> <value>hbase/_HOST@<Kerberos域名></value> </property> <property> <name>hbase.rpc.protection</name> <value>authentication</value> </property> ``` 5. 配置Spark的连接,可以通过以下步骤完成: (1)在Hue的配置文件中,设置以下参数: ``` [spark] ... # Spark settings ... spark_host=<Spark服务器IP地址> spark_port=<Spark服务器端口> ``` (2)在Spark的配置文件中,设置以下参数: ``` spark.authenticate=true spark.authenticate.secret=<Spark认证密钥> spark.master=yarn spark.eventLog.enabled=true spark.eventLog.dir=<Spark事件日志目录> ``` 6. 配置SparkSQL的连接,可以通过以下步骤完成: (1)在Hue的配置文件中,设置以下参数: ``` [spark] ... # SparkSQL settings ... spark_sql_host=<SparkSQL服务器IP地址> spark_sql_port=<SparkSQL服务器端口> ``` (2)在SparkSQL的配置文件中,设置以下参数: ``` spark.authenticate=true spark.authenticate.secret=<SparkSQL认证密钥> spark.sql.catalogImplementation=hive ``` 7. 配置PySpark的连接,可以通过以下步骤完成: (1)在Hue的配置文件中,设置以下参数: ``` [spark] ... # PySpark settings ... pyspark_host=<PySpark服务器IP地址> pyspark_port=<PySpark服务器端口> ``` (2)在PySpark的配置文件中,设置以下参数: ``` spark.authenticate=true spark.authenticate.secret=<PySpark认证密钥> ``` ### 回答2: CDH6.3是一款开源的大数据平台,它拥有众多的开源项目和工具,但是如果不能充分发挥这些工具的功能,即使搭建了CDH6.3也无法完成数据处理和分析任务。因此,在CDH6.3中,我们不仅需要熟悉各个组件的使用,还需要对它们进行配置,以满足我们的具体需求。 HueCDH6.3中非常流行的一个web界面,它提供了对各种Hadoop组件的操作,包括MySQL、Hive、HBase、Spark、SparkSQL和Pyspark。下面是它们的配置过程: MySQL配置:在Hue的配置文件中,需要设置数据库连接信息,包括数据库类型、地址、端口、用户名和密码等。配置好后,就可以在Hue上操作MySQL数据库。 Hive配置:在Hue中配置Hive相关配置需要设置一个元数据库,可以使用MySQL作为元数据存储库,配置还包括HDFS和YARN等相关配置。完成配置后,用户可以在Hue上运行Hive查询。 HBase配置:在Hue中配置HBase需要配置Hue和HBase的一些参数,主要是关于Hue的HBase API的参数,以及Hue主机的HBase客户端配置。完成配置后,用户可以使用HBase浏览器在Hue上访问HBase。 Spark配置:在Hue中集成Spark最直接的方法是通过Livy服务来连接Spark,配置需要指定Spark主机地址和端口等参数。配置好后,用户就可以在Hue上运行Spark任务。 SparkSQL配置:在Hue中配置SparkSQL需要在LIVY服务中设置SparkSQL的执行环境参数。由于SparkSQL依赖于Spark集群,因此需要在Livy服务中指定Spark集群的信息。同时,需要为Hive配置一个metastore用于SparkSQL的元数据存储。 Pyspark配置:Hue中集成Pyspark与Spark配置类似,通过Livy服务连接Pyspark,需要指定Python路径和Pyspark程序路径等参数。 总之,通过Hue配置CDH6.3中的组件,可以使用户在Web界面上方便的操作和管理各个组件,提高数据处理和分析效率。 ### 回答3: CDH是一个基于Apache Hadoop生态系统的分布式数据处理平台。HueCDH平台上一个重要的Web UI的组件,提供了图形界面来管理大数据。在CDH6.3中,Hue的配置涉及集成多个组件,包括MySQL、Hive、HBase、Spark、Spark SQL和PySpark。 集成MySQL: 1. 在Hue配置文件中,开启MySQL的支持,启用以下参数:[[database]],type=mysql,host=localhost,port=3306,user=hueuser,password=huepassword,name=huedb。 2. 在MySQL中创建一个Hue用户并授权,使用以下命令:CREATE USER 'hueuser'@'<Hue主机>' IDENTIFIED BY 'password'; GRANT ALL PRIVILEGES ON huedb.* TO 'hueuser'@'<Hue主机>'; 3. 在Hue服务器上安装MySQL JDK依赖项和MySQL客户端依赖项,运行以下命令: sudo yum install mysql-connector-java --skip-broken sudo yum install mysql --skip-broken 4. 重启Hue服务。 集成Hive: 1. 在Hue配置文件中,开启Hive的支持,启用以下参数:[[beeswax]],hive_server_host=localhost,hive_server_port=10000。 2. 配置Hive JDBC驱动程序,将hive-jdbc.jar拷贝到Hue服务器上,并在 /etc/hue/conf/hue.ini 中配置以下: [jdbc] # The JDBC driver to use to connect to Hive hive_jdbc_jar=/usr/hdp/current/hive-client/lib/hive-jdbc.jar 3. 重启Hue服务。 集成HBase: 1. 在Hue配置文件中,开启HBase的支持,启用以下参数:[[hbase]],hbase_clusters=CDHCluster,hbase_clusters_live=CDHCluster。 2. 将 HBase 配置文件复制到 Hue 安装目录 /etc/hue/conf.dist 的 /etc/hue/conf/ 目录中。 3. 使用以下命令指定HBASE_HOME环境变量: export HBASE_HOME=/usr/lib/hbase 4. 启动Hue服务。 集成Spark 和 Spark SQL: 1. 在Hue配置文件中,开启Spark和Spark SQL的支持,启用以下参数: [[spark]] livy_server_host=localhost livy_server_port=8998 [[sparksql]] pyspark_submit_args=--master yarn-cluster --deploy-mode client 2. 安装Livy服务器,Livy是Spark的REST接口,通过Livy可以远程提交Spark作业。Livy服务器和Spark集群必须安装在同一台服务器上。 3. 在/etc/hue/conf/hue.ini文件中配置Livy服务器信息: [livy] server_url=http://localhost:8998 4. 重启Hue服务。 集成PySpark: 1. 在Hue配置文件中,开启PySpark的支持,启用以下参数:[[spark]],enable_pyspark=true,pyspark_submit_args=--master yarn-cluster --deploy-mode client。 2. 修改spark-env.sh文件,打开该文件并配置以下参数: export PYTHONPATH=/usr/lib/spark/python/:/usr/lib/spark/python/lib/py4j-0.9-src.zip:/usr/lib/hue/tools/lib/python 3. 重启Hue服务。 通过以上步骤,CDH6.3中的Hue已经成功集成了MySQL、Hive、HBase、Spark、Spark SQL和PySpark,用户可以使用Hue提供的Web UI来管理和查询大数据集群。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值