Zeppelin简介
Apache Zeppelin是基于Web的笔记本notebook,支持Spark,Python,SQL,Scala等数据驱动的交互式数据分析和协作文档。
Zeppelin Notebook可以满足数据摄取、数据发现、数据分析、数据可视化与协作。
可视化支持的开发语言与技术
支持Spark、PySpark、Spark R、Spark SQL(包含加载这些模块的依赖)
允许无缝连接任何JDBC数据源,Postgrepsql、Mysql、MariaDB、Redshift、Apache Hive等
Python支持,集成Matplotlib、Conda、Pandas SQL、PySpark
官网:http://zeppelin.apache.org/
源代码地址:https://github.com/apache/zeppelin
zeppelin的使用场景
在大数据应用场景中,处理数据分析方面,由于开发者的水平不一样,使用的编程语言也不尽相同,可能会涉及到R、Python、Java、Scala等,数据计算模型也估计不一样,可能涉及的有Spark、Hive、Flink、Kylin等等。
如果有一个工具,可以让你在同一个Web页面上写Shell代码,Python代码,Scala代码,你想要么? 如果还可以执行PySpark代码和Spark代码呢?心动了吗? 如果还可以写Hive-SQL,Spark-SQL呢? 如果还可以把这些代码保存起来,并形成文档,支持Markdown语法,如何? 如果还可以将SQL的结果在Web界面上可视化出来呢? 如果还支持R语言,还支持Kylin呢?还支持Angular呢?还支持PostgreSQL呢?不信你不心动。
Zeppelin安装简要说明
选择一台服务器安装,安装在node03服务器上。
下载Zeppelin安装包
下载网址:http://zeppelin.apache.org/download.html
软件\2.zeppelin\zeppelin-0.8.0-bin-all.tgz
上传安装包到指定路径/export/softwares目录下并解压
tar -zxvf zeppelin-0.8.0-bin-all.tgz -C /export/servers/ |
启动Zeppelin
# 启动 bin/zeppelin-daemon.sh start # 停止命令 bin/zeppelin-daemon.sh stop |
查看zeppelin服务是否安装成功
打开浏览器web地址
出现下图页面,即服务安装成功
zeppelin ui介绍
打开地址:h