jupyterhub+k8s+spark/yarn

最新推荐文章于 2024-05-20 09:32:50 发布

awangyuk

最新推荐文章于 2024-05-20 09:32:50 发布

阅读量890

点赞数

分类专栏： spark k8s

本文链接：https://blog.csdn.net/u011739062/article/details/103183740

版权

k8s 同时被 2 个专栏收录

16 篇文章 0 订阅

订阅专栏

spark

3 篇文章 0 订阅

订阅专栏

1.生产集群若是是Spark/Yarn，方便集成(docker内部链接到现有spark on yarn集群)
2.自定义镜像

2.1 work机上安装python3.7 link到/opt/conda/bin/python

FROM jupyter/all-spark-notebook:2ce7c06a61a1


ENV HADOOP_HOME /usr/local/hadoop
ENV JAVA_HOME /usr/lib/jvm/java-8-openjdk-amd64
ENV HADOOP_CONF_HOME /usr/local/hadoop/etc/hadoop
ENV HADOOP_CONF_DIR /usr/local/hadoop/etc/hadoop
ENV PYSPARK_PYTHON /opt/conda/bin/python
ENV PYSPARK_DRIVER_PYTHON /opt/conda/bin/python

USER root

COPY hadoop  /usr/local/hadoop

# spark-default.conf
RUN echo "spark.driver.extraJavaOptions -Dhdp.version=2.5.3.0-37" >> /usr/local/spark/conf/spark-defaults.conf && \
echo "spark.yarn.am.extraJavaOptions -Dhdp.version=2.5.3.0-37" >> /usr/local/spark/conf/spark-defaults.conf && \
echo "spark.master=yarn" >> /usr/local/spark/conf/spark-defaults.conf && \
echo "spark.yarn.jars=hdfs://192.168.56.103:9000/spark/jars/*" >> /usr/local/spark/conf/spark-defaults.conf && \
echo "spark.eventLog.dir=hdfs://192.168.56.103:9000/spark/logs" >> /usr/local/spark/conf/spark-defaults.conf && \
echo "spark.hadoop.yarn.timeline-service.enabled=false" >> /usr/local/spark/conf/spark-defaults.conf && \
chown -R $NB_USER:users /usr/local/spark/conf/spark-defaults.conf 

RUN jupyter toree install --sys-prefix --spark_opts="--master yarn --deploy-mode cluster --driver-memory 512m \ 
 --executor-memory 512m --executor-cores 1 --driver-java-options -Dhdp.version=2.5.3.0-37 --conf spark.hadoop.yarn.timeline-service.enabled=false"

RUN chown jovyan -R /home/jovyan/.local
COPY slaves  /usr/local/spark/conf
COPY spark-env.sh  /usr/local/spark/conf

USER $NB_USER

3.测试(查看yarn集群application)（scala\pthon）

awangyuk

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
jupyterhub+k8s+spark/yarn

1.生产集群若是是Spark/Yarn，方便集成(docker内部链接到现有spark on yarn集群)2.自定义镜像 2.1 work机上安装python3.7 link到/opt/conda/bin/pythonFROM jupyter/all-spark-notebook:2ce7c06a61a1ENV HADOOP_HOME /usr/local/hadoop...
复制链接

扫一扫

专栏目录