Zeppelin是什么
Apache Zeppelin 是一个让交互式数据分析变得可行的基于网页的notebook。Zeppelin提供了数据可视化的框架。Apache Zeppelin 是一个让交互式数据分析变得可行的基于网页的开源框架。... 这个编译器是让用户可以使用自定义的语言做为数据处理后端的一个Zeppelin 插件。
缘由
虽然笔者是一名java工程师,但由于工作的需要,最近接触到了大数据的一部分的内容。起因是想将spark处理后的数据做可视化展示,由于灵活可配置的需要,急需要更加灵活,轻量的数据可视化平台。经过短暂调研,Zeppelin便进入我的视野。
01
快速安装
Zeppelin 0.8.1安装
Zeppelin 对于讨厌linux界面的小伙伴们是福音,它有更好看的界面,对于有一定编程能力(不限于shell、sql、python、spark)的分析师更是福音。用简单的操作就能做出图形展示。我也是第一次接触Zeppelin,大家一起来学习。
1.下载Zeppelin
下载Zeppelin0.8.1(包含全部的interpreter):http://archive.apache.org/dist/zeppelin/zeppelin-0.8.1/zeppelin-0.8.1-bin-all.tgz
tar zxvf zeppelin-0.8.1-bin-all.tgz
2.配置Zeppelin
cd conf/
cp shiro.ini.template shiro.ini
cp zeppelin-env.sh.template zeppelin-env.sh
cp zeppelin-site.xml.template zeppelin-site.xml
3.启动Zeppelin
bin/zeppelin-daemon.sh start
02
快速入门interpreter
初次打开浏览器便可得到如下界面:
然后做如下操作:
搜索需要配置的Interpreter
配置以下必备配置项:
配置驱动并保存以上信息
新建note
输入sql即可获得饼状图
Tips:笔者在2c4G上运行,亲测不会OOM,在1c2G虚机上启动会报OOM,并释放jvm诊断文件。
欢迎关注我的公众号:彪悍大蓝猫