Zeppelin结合Spark等各种Interpreter的使用
Apache Zeppelin是基于Web的笔记本,支持SQL、Scala等数据驱动的交互式数据分析和协作文档。技术方面主要有Spark、SQL、Python。在部署方面支持单个用户也支持多用户。
Zeppelin Notebook可以满足数据摄取、数据发现、数据分析、数据可视化与协作。
多语言后端
Apace Zeppelin解析器概念允许将任何语言/数据处理后端插入Zeppelin,目前Apache Zeppelin迟滞许多解释器,入Apache Spark,python,JDBC,Markdown和shell。
安装Zeppelin请参考官网:http://zeppelin.apache.org/
原理简介
Interpreter
Zeppelin中最核心的概念是Interpreter,interpreter是一个插件允许用户使用一个指定的语言或数据处理器。每一个Interpreter都属于一个InterpreterGroup,同一个InterpreterGroup的Interpreters可以相互引用,例如SparkSqlInterpreter 可以引用 SparkInterpreter 以获取 SparkContext,因为他们属于同一个InterpreterGroup。当前已经实现的Interpreter有spark解释器