Ambari 2.1安装HDP2.3.2 之七、自定义HDP服务

大兰子小丸子

于 2016-08-16 18:30:20 发布

阅读量2.5k

点赞数

分类专栏： HDP平台文章标签： zeppelin hdp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_28224453/article/details/52223621

版权

HDP平台专栏收录该内容

8 篇文章 2 订阅

订阅专栏

以zeppelin为例，它是一个基于网页的notebook，可以进行数据分析与可视化，zeppelin里有个概念是解释器，解释器使得很多后端语言能够像插件一样在zeppelin中使用，例如 Spark,、Python、sql、shell等等。具体介绍看zeppelin官网。

添加zeppelin服务时不必关掉其他服务。
我要用到python，而支持python的话需要自己编译zeppelin。
将编译好的zeppelin打包命名为zeppelin.tar.gz，拷贝到/tmp 文件夹下。

1. 下载服务向导包并解压

代码如下，其中，$VERSION 是HDP对应的版本号。

wget https://github.com/hortonworks-gallery/ambari-zeppelin-service/archive/master.zip -O /tmp/ZEPPELIN.zip
unzip /tmp/ZEPPELIN.zip -d /var/lib/ambari-server/resources/stacks/HDP/$VERSION/services

登入ambari 管理页面后，左侧一栏点击 Actions ，结果如图：

这里写图片描述

勾选上zeppelin notebook:

这里写图片描述

选择安在某台机器上都可以，我选的master :

这里写图片描述

下一步，开始设置各项参数。

这里写图片描述

其中需要注意的有：
设置
zeppelin.install_python_packages=true，表示要下载python包，
zeppelin.setup.prebuilt=true, 表示我们用自己编译的zeppelin，就是我们提前放到/tmp下的zeppelin.tar.gz。
zeppelin.setup.view=true，表示有zeppelin view的快捷打开页面。

下面 zeppelin.executor.mem在这儿以下，根据你自己的内存及任务需要内存设置即可。一般512m够用。

这里写图片描述

在zeppelin-env template里，需要注意的有：
export MASTER=yarn-client
代表zeppelin的任务要提交到yarn上执行。除了在yarn上执行，还可以本地执行，值为local。
SPARK_HOME HADOOP_CONF_DIR和PYTHONPATH
要确保这些没有被注释。

这里写图片描述

在custom zeppelin-config里，添加一个属性：

zeppelin.host.publicname，值为安装zeppelin服务的机器的域名，对本集群而言，是master.org.cn，如图：

确认好配置信息后，下一步，

这里写图片描述

好了，开始安装啦~

这里写图片描述

等它完事儿就好~~

大兰子小丸子

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

大兰子小丸子

博客等级

码龄9年

22
原创

151
点赞

477
收藏

109
粉丝

关注

私信

热门文章

分类专栏

airflow 1篇
HDP平台 8篇
aimms 1篇
matlab 3篇
pyhton 2篇
java 2篇
搜索引擎 1篇
regression 2篇
SVR 1篇
mysql 2篇
elasticsearch 1篇
spark 1篇

最新评论

pyspark之创建SparkSession
地铁博尔特: 楼主，Exception: Java gateway process exited before sending its port number 这是什么原因呢？搜了好多都没解决
python实践系列之（一）安装 python/pip/numpy/matplotlib
qq_41645219: 非常感谢楼主！
学习MySQL的第一步：安装MySQL及数据库可视化工具Navicat
学不进去啊这代码: 还好看到你的评论了！修改密码成功!
如何保存Windows聚焦的锁屏壁纸
tbywt: 这个目录找不到锁屏壁纸啊
Ubuntu上搭建airflow+celery以及配置环境
北风之神c: 写得赞，博主用心了，但主要还是celery太难了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字，所以网上的celery博客教程虽然很多，但是并不能学会使用，因为要运行起来需要以下6个方面都掌握好，博客文字很难表达清楚或者没有写全面以下6个方面。 celery消费任务不执行或者报错NotRegistered，与很多方面有关系，如果要别人排错，至少要发以下6方面的截图， 1) 整个项目目录结构,celery的目录结构和任务函数位置，有很大影响 2) @task入参 ,用户有没有主动设置装饰器的入参 name,设置了和没设置有很大不同，建议主动设置这个名字对函数名字和所处位置依赖减小 3) celery的配置，task_queues(在3.xx叫 CELERY_QUEUES )和task_routes (在3.xx叫 task_routes) 4) celery的配置 include （在3.xx叫 CELERY_INCLUDE）或者 imports (3.xx CELERY_IMPORTS) 或者 app.autodiscover_tasks的入参 5) cmd命令行启动参数 --queues= 的值 6) 用户在启动cmd命令行时候，用户所在的文件夹。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 https://function-scheduling-distributed-framework.readthedocs.io/zh_CN/latest/index.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等19个方面全方位超过celery，任何方面都是有过之而无不及。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。