1. 什么是Apache Zeppelin
在正式进入Apache Zeppelin的正题之前,我们必须先了解两个概念。
REPL
REPL全称是Read Evaluate Print Loop,交互式解释器环境,通过交互式界面接收用户输入,交互式解释器读取输入内容并对它求值,返回结果,并重复此过程。
Jupyter Notebook
Jupyter Notebook(早期叫IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。Jupyter Notebook 的是一个Web应用程序,便于创建和共享程序文档,支持实时代码、数学方程、可视化和Markdown语法,常用在数据清理转换、数值模拟、统计建模、机器学习等业务场景。
1.1 官方的定义
Apache Zeppelin官方网站的定义如下
Web-based notebook that enables data-driven, interactive data analytics and collaborative documents with SQL, Scala and more.
翻译过来就是
Zeppelin是支持数据驱动、交互式数据分析、协作式文档等特性的基于Web的交互式应用开发引擎,应用以Notebook形式表示,支持Scala、Python、SQL、Markdown、shell等多种语言。
其中,Notebook是来自于Jupyter的概念,