Apache Zeppelin是一款基于web的notebook(类似于ipython的notebook),支持交互式地数据分析。原生就支持Spark、Scala、SQL 、shell, markdown等。而且它是完全开源的,目前还处于Apache孵化阶段。本文所有的操作都是基于Apache Zeppelin 0.6.0-incubating-SNAPSHOT,spark 1.5.2的。
本文将介绍如何编译、安装以及使用Apache Zeppelin。
编译和安装Apache Zeppelin
Apache Zeppelin官方提供了Source包和二进制包,我们可以根据需要下载相关的包进行安装。这里我通过编译源码的方式来安装Apache Zeppelin,通过源码编译Zeppelin非常地简单,我这里从Zeppelin的git库里面下载最新的源码进行编译,步骤如下:
[iteblog@www.iteblog.com ~]$ git clone https://github.com/apache/incubator-zeppelin.git[iteblog@www.iteblog.com ~]$ cd incubator-zeppelin[iteblog@www.iteblog.com ~]$ mvn package -Pspark-1.5 -Dhadoop.version=2.2.0 -Phadoop-2.2 -DskipTests[INFO] Reactor Summary:[INFO] [INFO] Zeppelin ........................................... SUCCESS [ 4.336 s][INFO] Zeppelin: Interpreter .............................. SUCCESS [ 4.525 s][INFO] Zeppelin: Zengine .......