linux下spark的python编辑_关于Linux下Spark的配置

1 如果你是用scala,当我没说。这个随意都能搞得定

2 如果你是用python,你可以继续往后看。

因为spark的全量的安装包自己带的hadoop的环境,所以不需要自己去再配一个hadoop。[如果你有的话,则得确保版本兼容之类的时期]

单独解压缩一个spark的包,然后去修改相应的配置文件。[反正我是没有去配yarn的和hadoop的,直接默认,这里面坑太多了]

3 别忘记安装pyspark和py4j,anaconda 直接用pip就好。如果是anaconda用户,记得创建一个python的环境,conda create --name python python=3.6(这个是版本号,自己定义)

4 有了python环境了就可以去spark下面去试用python文件夹下的pyspark了。这个demo有的是,随便搜

5 pycharm也要改东西,这个也搜的到,无非就是PYTHON_PATH和SPARK_HOME之类的。

6 借助os的包:

import findspark

import os

PYSPARK_PYTHON = "/home/promoriarty/anaconda3/bin/python"

os.environ["PYSPARK_PYTHON"] = PYSPARK_PYTHON

from pyspark import SparkConf,SparkContext

conf = SparkConf().setAppName("test").setMaster("local")

sc = SparkContext(conf=conf)

text = sc.textFile("file:///home/promoriarty/1")

text.foreach(print)

反正我是这样把demo跑起来了。。折腾了好久。。

参考:http://blog.csdn.net/huobanjishijian/article/details/52538078

真是谢谢这个老哥了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是在Linux系统上配置Pycharm中使用Python Spark的步骤: 1. 安装Java和Spark:首先需要安装Java和Spark。如果您已经安装了它们,请跳过此步骤。如果没有安装,请执行以下命令: ``` sudo apt-get update sudo apt-get install openjdk-8-jdk wget https://downloads.apache.org/spark/spark-3.1.1/spark-3.1.1-bin-hadoop3.2.tgz tar -xvf spark-3.1.1-bin-hadoop3.2.tgz ``` 2. 配置环境变量:为了在Pycharm中使用Spark需要Spark的路径添加到您的环境变量中。在终端中运行以下命令: ``` export SPARK_HOME=/path/to/spark export PATH=$SPARK_HOME/bin:$PATH ``` 其中,`/path/to/spark` 是Spark的安装路径。如果您的Spark位于`/usr/local/spark`,则可以使用以下命令: ``` export SPARK_HOME=/usr/local/spark export PATH=$SPARK_HOME/bin:$PATH ``` 为了方便,您可以将这些命令添加到您的`.bashrc`文件中。 3. 安装PySpark:在Pycharm中使用Spark需要安装PySpark。您可以使用以下命令安装: ``` pip install pyspark ``` 4. 配置Pycharm:打开Pycharm并创建一个新项目。在项目设置中,选择Python解释器并确保已选择正确的Python版本。然后,单击“添加”按钮并添加以下行: ``` PYSPARK_PYTHON=/usr/bin/python3 PYSPARK_DRIVER_PYTHON=python3 ``` 然后,单击“环境变量”选项卡并添加以下行: ``` SPARK_HOME=/path/to/spark ``` 其中,`/path/to/spark` 是Spark的安装路径。如果您的Spark位于`/usr/local/spark`,则可以使用以下行: ``` SPARK_HOME=/usr/local/spark ``` 5. 导入pyspark:在Pycharm中导入pyspark非常简单。只需在项目中创建一个Python文件并添加以下代码: ``` from pyspark import SparkContext sc = SparkContext("local", "First App") ``` 这将创建一个本地Spark上下文并打印出一条消息。您可以运行此代码以确保一切正常。 希望这些步骤能够帮助您在Linux系统上配置Pycharm中使用Python Spark

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值