1. 在CDH上安装Anaconda Parcel(离线或者远程安装anaconda parcel)
下载Anaconda Parcels,下载符合自己的版本及其sha文件
将下载好的文件上传至你的CDH parcels库,一般位置在 /opt/cloudera/parcel-repo
进入CDH管理界面,进行相关配置
!配置界面
刷新之后就能够看到Anaconda已下载成功。然后分发、激活。
2. 相关配置
2.1主节点配置
在/etc/profile.d/增加一个自己的文件, 如startpyspark.sh
# 为pyspark设置环境变量
export PYSPARK_DRIVER_PYTHON=/opt/cloudera/parcels/Anaconda/bin/jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook --NotebookApp.open_browser =False --NotebookApp.ip='*' --NotebookApp.port=8880"
export PYSPARK_PYTHON=/opt/cloudera/parcels/Anaconda/bin/python
export PATH=/opt/cloudera/parcels/Anaconda/