spark2.x-pyspark-windows环境搭建

最新推荐文章于 2024-06-30 07:15:00 发布

猿与禅

最新推荐文章于 2024-06-30 07:15:00 发布

阅读量1k

点赞数

分类专栏： spark 文章标签： spark python pyspark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_16038125/article/details/79004776

版权

spark 专栏收录该内容

51 篇文章 1 订阅

订阅专栏

pyspark开发指南

1、pyspark 本地开发环境搭建
python版本最好与集群环境一致，我这里是 python 3.5.2
参考资料即可

http://blog.csdn.net/funfun0/article/details/77802590

注意:
windows 64位的Java安装在C:\Program Files\下，导致最终的PATH中包含了空格，
需将环境变量中的JAVA_HOME改成C:\progra~1\Java\jdk1.8.0_60 或者 “C:\Program Files”\Java\jdk1.8.0_60。
2、pyspark 任务提交
演示：以日起始里程统计作业为例，环境为研发环境

a、开发：
见StartStopMileage.py

b、提交：
spark任务提交脚本
sh StartStopMileage-dev.sh 20171120

#!/bin/bash

 /usr/local/spark/bin/spark-submit \
   --master yarn \ #指定资源管理器
   --deploy-mode client \ #指定提交模式
   --executor-memory 2G \ #指定executor内存大小
   --num-executors 10 \ #指定executor个数
   --executor-cores 2 \ #指定executor虚拟CPU核数
   --driver-memory 2G \ #指定driver内存大小
   --queue spark \ #指定资源队列
  /home/hadoop/StartStopMileage.py \ #指定运行的python脚本
   dev  \  #python
   $1

c、运行:

如果程序有错误，中间会报异常

d、spark web-ui监控

e、结果
生成hdfs 文件，说明运行成功！

3、交互式命令行
进入spark 安装目录
执行./bin/pyspark
进入pyspark命令行

内置加载了几个对象，不用声明可直接使用

spark = SparkSession.builder\
    .enableHiveSupport()\
    .getOrCreate()

sc = spark.sparkContext
sql = spark.sql

sqlContext = spark._wrapped
sqlCtx = sqlContext

演示：读取hdfs 文件

spark.read.parquet("/spark/vehicle/data/realinfo/year=2017/month=11/day=02").show



 sc.textFile("/tmp/zyt/StartStopMileage440004").take(1)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

猿与禅 CSDN认证博客专家 CSDN认证企业博客

码龄10年

278: 原创

1万+: 周排名

6510: 总排名

68万+: 访问

: 等级

7606: 积分

3473: 粉丝

518: 获赞

78: 评论

941: 收藏

私信

关注

热门文章

分类专栏

最新评论

vuejs-入门命令大全
CSDN-Ada助手: 这些前端编译工具使用不同的语言开发: esbuild(Go), SWC(Rust), Bun(Zig), Parcel 2(JS/Rust), Vite(JS/Go), napi-rs(Rust)，这说明了什么问题？
AI大模型-使用 FastChat 部署ChatGLM3
猿与禅: 可以的，文章最后有我的微信名片
AI大模型-使用 FastChat 部署ChatGLM3
湾区会客厅: 文章写的不错，有机会可以交流一下？
ollama集成open-webui本地部署大模型应用
普通网友: 好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
docker 安装
猿与禅: 1. **创建和启动服务容器**： - `docker-compose up`：启动服务容器并根据需要构建镜像。加上 `-d` 参数（`docker-compose up -d`）则会在后台（detached mode）启动容器。 - `docker-compose up --build`：在启动服务之前先重新构建镜像。 2. **停止并删除容器、网络和卷**： - `docker-compose down`：停止并删除由 `docker-compose up` 创建的所有资源，包括容器、网络和挂载的数据卷。若要保留卷，可以使用 `docker-compose down --volumes=false`。 3. **查看服务状态**： - `docker-compose ps`：列出所有服务及其容器的当前状态。 4. **重新创建容器**： - `docker-compose restart [SERVICE...]`：重启指定服务或所有服务的容器。 5. **进入容器**： - `docker-compose exec [SERVICE] [COMMAND]`：在指定服务的容器内执行命令。 6. **查看日志**： - `docker-compose logs [SERVICE...]`：查看服务容器的日志输出。 7. **构建镜像**： - `docker-compose build [SERVICE...]`：构建（或重新构建）服务的镜像。 8. **运行一次性命令**： - `docker-compose run [SERVICE] [COMMAND]`：在指定服务的容器中运行一次性命令，不改变服务的容器状态。 9. **配置检查**： - `docker-compose config`：验证并打印YAML配置文件的解析结果。 10. **暂停与恢复服务**： - `docker-compose pause [SERVICE...]`：暂停服务容器的运行。 - `docker-compose unpause [SERVICE...]`：恢复已暂停的服务容器。除此之外，还有其他一些命令，如： - `docker-compose pull`：拉取服务所需的镜像。 -

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

猿与禅 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。