pycharam + spark整合

1.下载pycharm 

2.安装python(linux,mac一般都有python2.7,3.5)略

3.安装spark 环境,不是重点略.

4.安装pip
curl -O https://bootstrap.pypa.io/get-pip.py
 
使用Python安装pip(升级pip install --upgrade pip [如需要 sudo]

python get-pip.py


pip 安装模块 pin install 模块名
pip freeze

5.安装spark 需要的py4j

pip install py4j


6.项目导入SPARK_HOME下python目录pyspark.zip,及py4j.zip

项目--->File--->setting-->project interceptor -->最有边 绿色+ (加号)添加第三方模块


注:如遇到无法安装(一般是权限),可以使用sudo  pip(对应python 版本,pip -V查看)  模块名


7.配置SPARK_HOME,PYTHON_HOME
a)创建python文件,然后进行配置上述两个变量

右上角(对应python文件)-->edit configuration-->Enviroment Variable

改行最有边(三个...)点击,添加key,value(上述两个变量)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值