安装 py4j
首先在wim上打开dos窗口 (win键+r 输入cmd)
输入指令: pip install py4j
然后再PYTHON_HOME\Lib\site-packages (你的python)目录创建文件 pyspark.pth
打开pyspark.pth内容为:
SPARK_HOME\python (你的spark安装目录)
测试通过!
首先在wim上打开dos窗口 (win键+r 输入cmd)
输入指令: pip install py4j
然后再PYTHON_HOME\Lib\site-packages (你的python)目录创建文件 pyspark.pth
打开pyspark.pth内容为:
SPARK_HOME\python (你的spark安装目录)
(下载地址 pycharm ---- http://www.jetbrains.com/pycharm/download)
RUN----》Edit Config..
然后添加属性:
----------测试一把------------------
"""SimpleApp"""
from pyspark import SparkContext
logFile = 'D:\\spark\\README.md'
sc = SparkContext("local","Simple App")
logData = sc.textFile(logFile).cache()
numAs = logData.filter(lambda s: 'a' in s).count()
numBs = logData.filter(lambda s: 'b' in s).count()
print("Lines with a: %i, lines with b: %i"%(numAs, numBs))
测试通过!