基于项目中要使用Spark的原因,所以使用Zeppelin使用Spark ML,并进行数据展示是比较好的选择,在搭建0.9.0的时候也解决了几个入坑问题,现在把具体情况说明下:
1.首先下载最新的0.9.0-preview2版本
下载1.5G的zeppelin-0.9.0-preview2-bin-all.tgz
2.下载完后,使用tar -xzvf 解压文件
3.修改/etc/profile文件,最下面添加如下一句:
export JAVA_TOOL_OPTIONS="-Dzeppelin.interpreter.dep.mvnRepo=http://insecure.repo1.maven.org/maven2/"
4.cp zeppelin-site.xml.template zeppelin-site.xml,然后修改zeppelin-site.xml
<property>
<name>zeppelin.server.addr</name>
<value>0.0.0.0</value>
<description>Server binding address</description>
</property>
5.到bin目录使用./zeppelin-daemon.sh start启动
6.看到启动页面如下,http://ip地址:8080 同时配置仓库界面如下,即说明安装成功
7.设置phoenix解释器,添加新的interpreters
设置依赖包
7.设置成功后,设置新的note,如下图所示:
8.使用SQL语句,如果能成功看到表名,则说明配置成功
FAQ
具体配置可以看如下链接:
http://zeppelin.apache.org/docs/latest/setup/operation/configuration.html