Zeppelin简介
- Zeppelin是一个Apache的孵化项目.
一个基于web的笔记本,支持交互式数据分析。你可以用SQL、Scala等做出数据驱动的、交互、协作的文档。(类似于ipython notebook,可以直接在浏览器中写代码、笔记并共享)
- 多用途笔记本
可实现你所需要的:
- 数据采集;
- 数据发现;
- 数据分析;
- 数据可视化和协作。 一些基本的图表已经包含在Zeppelin中。可视化并不只限于SparkSQL查询,后端的任何语言的输出都可以被识别并可视化; Notebook 的 URL 可以在协作者间分享。Zeppelin 然后可以实时广播任何变化,就像在 Google docs 中一样。
- 支持多种语言,默认是scala(背后是spark shell),SparkSQL, Markdown , Shell , flink sql 1.10(版本0.9.0) 等
- 发布. Zeppelin 提供了一个 URL 用来仅仅展示结果,那个页面不包括 Zeppelin 的菜单和按钮。这样,你可以轻易地将其作为一个iframe集成到你的网站。
- 100% 开源.有很多的并且是非常活跃的开发社区.
编译
mvn clean package -Pspark-1.3 -Dhadoop.version=2.3.0 -Phadoop-2.3 -DskipTests
- 启动 编译成功后,解压直接启动
bin/zeppelin-daemon.sh start
- 启动成功后会显示下图
- 可能遇到的问题
问题:在linux中显示启动成功,但是在浏览器中不显示
分析:Zeppelin默认的ip是127.0.0.1,只能用localhost或这个ip访问;还有就是可能你的端口号被占用了
解决:在你的Zeppelin的conf文件中
1.复制zeppelin-site.xml.template一份文件,重命名zeppelin-site.xml
2.vim zeppelin-site.xml
3.修改zeppelin.server.addr和zeppelin.server.port为自己的ip和可用端口
4.重启Zeppelin
配置用户名密码访问登录