No module named pyspark

添加环境变量

想使用python提交spark任务,第一步琚遇到错误
这里写图片描述

在 集群所有机器的/etc/profile上添加环境变量

:$SPARK_HOME/python:$SPARK_HOME/python/lib/py4j-0.9-src.zip

直接运行pyspark
这里写图片描述

为Spark创建一个iPython配置

创建配置

这里写图片描述

在 /root/.ipython/profile_pyspark/startup 目录下编辑一个 00-pyspark-setup.py python 脚本

import os
import sys

spark_home=os.environ.get('SPARK_HOME',None)
if not spark_home:
  raise ValueError('SPARK_HOME environment variable is not set')
sys.path.insert(0,os.path.join(spark_home,'python'))
sys.path.insert(0,os.path.join(spark_home,'python/lib/py4j-0.9-src.zip'))
execfile(os.path.join(spark_home,'python/pyspark/shell.py'))

py4j-0.9-src.zip 根据自己spark路径下,/root/workspace/software/spark1.6.1_hadoop2.6/python/lib里的文件确定
这里写图片描述
我这里是py4j-0.9-src.zip

启动ipython

启动ipython 设置 –profile=pyspark 就会自动启动pysprak
这里写图片描述


测试pysprak 是否能用
这里写图片描述
OK, 至此,pyspark 基本上正常工作了。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值