Python大数据之PySpark(二)PySpark安装_支持 依赖项 ‘python pyspark‘ 的插件 spark 当前尚未安装。

  • 1-使用base的环境安装
  • image-20210907152724447
  • 2-使用pyspark_env方式安装
  • image-20210907152601245
  • 查看启动结果

  • image-20210907153140798

  • 简单的代码演示

  • image-20210907153335422

  • 在虚拟环境下的补充

  • image-20210907153553522

  • webui

  • image-20210907153745013

  • 注意:

    • 1-1个Spark的Applicaition下面有很多Job
    • 2-1个Job下面有很多Stage

Jupyter环境设置

监控页面

  • 4040的端口
  • image-20210907164238934
  • image-20210907164121516

运行圆周率

  • 回顾Hadoop中可以使用
  • hadoop jar xxxx.jar 100
  • yarn jar xxxx.jar 1000
  • 跑的mr的任务
  • Spark中也有对应的提交任务的代码
  • spark-submit 提交圆周率的计算代码 */examples/src/main/python/pi.py*
  • 提交的命令:

bin/spark-submit --master local[2] /export/server/spark/examples/src/main/python/pi.py 10
或者

# 基于蒙特卡洛方法求解的Pi,需要参数10,或100代表的次数
bin/spark-submit \
--master local[2] \
/export/server/spark/examples/src/main/python/pi.py  \
10

  • 10
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值