Zeppelin简介
Apache Zeppelin是基于Jupyter Notebook技术开发的大数据交互分析服务软件。
- 源码:https://github.com/apache/zeppelin
- 官网:http://zeppelin.apache.org/
- 文档:http://zeppelin.apache.org/docs/0.7.0/index.html
- 容器运行:docker run --name zeppelin -p 8080:8080 aquila/zeppelin
下面,我们自己来构建Zeppelin容器,从而可以修改版本,安装其它需要的软件。
Dockerfile
将下面内容保存为Dockerfile,然后使用docker build . 命令进行容器构建。
FROM ubuntu:14.04
MAINTAINER Andreas Lang <andreas.lang@aquilainsight.com>
ENV TERM=xterm \
MIRROR=http://www.mirrorservice.org/sites/ftp.apache.org/incubator
ENV ZEPPELIN_VERSION=0.5.5 \
ZEPPELIN_SRV_DIR=/srv/zeppelin
ENV ZEPPELIN_ARCHIVE=zeppelin-$ZEPPELIN_VERSION-incubating-bin-all
ENV ZEPPELIN_HOME=/opt/zeppelin/$ZEPPELIN_ARCHIVE \
ZEPPELIN_NOTEBOOK_DIR=$ZEPPELIN_SRV_DIR/notebooks
RUN apt-get update && apt-get install -y \
curl \
openjdk-7-jdk \
python-numpy \
&& apt-get clean \
&& rm -rf /var/lib/apt/lists/*
RUN mkdir /opt/zeppelin
WORKDIR /opt/zeppelin
RUN curl $MIRROR/zeppelin/${ZEPPELIN_VERSION}-incubating/${ZEPPELIN_ARCHIVE}.tgz | tar xfz -
COPY lib/*.jar ${ZEPPELIN_HOME}/lib/
EXPOSE 8080 ENV PATH=$PATH:$ZEPPELIN_HOME/bin RUN mkdir -p $ZEPPELIN_NOTEBOOK_DIR
WORKDIR $ZEPPELIN_SRV_DIR
ADD run.sh run.sh
CMD $ZEPPELIN_SRV_DIR/run.sh
ComposeFile
将下面内容保存为dockercompose.yml,然后使用dockercompose up -d运行容器服务。
zeppelin:
image: aquila/zeppelin
environment:
ZEPPELIN_SERVER_CONTEXT_PATH: /zeppelin
ZEPPELIN_MEM: "-Xmx2028m -XX:MaxPermSize=512m"
volumes:
- zeppelin-notebooks:/srv/zeppelin/notebooks
restart: always