一、简介
它提供了一个非常友好的 WebUI 界面,操作相关指令。它可以用于做数据分析和可视化。其后面可以接入不同的数据处理引擎。包括 Flink,Spark,Hive 等。支持原生的 Scala,Shell,Markdown 等。
Zeppelin是一个Apache的孵化项目.
一个基于web的笔记本,支持交互式数据分析。你可以用SQL、Scala等做出数据驱动的、交互、协作的文档。(类似于ipython notebook,可以直接在浏览器中写代码、笔记并共享)
可以看作一个多用途笔记本。
可实现你所需要的:
- 数据采集
- 数据发现
- 数据分析
- 数据可视化和协作
支持多种语言,默认是scala(背后是spark shell),SparkSQL, Markdown 和 Shell。
二、安装
因为是100%开源的,我们可以在官方直接下载安装包即可,这里我用的是0.8.1的版本
下载安装到Opt目录下
修改配置文件(包含改名)
vi zeppelin-site.xml
将默认的端口8080修改位其他数字(8000),目的是为了避免冲突