spark提交python脚本并传参

最新推荐文章于 2024-05-10 17:21:54 发布

置顶张小竟

最新推荐文章于 2024-05-10 17:21:54 发布

阅读量8.3k

点赞数 3

分类专栏： java Python 文章标签： spark python json 传参

本文链接：https://blog.csdn.net/zhanglu1236789/article/details/84106668

版权

java 同时被 2 个专栏收录

60 篇文章 0 订阅

订阅专栏

Python

11 篇文章 0 订阅

订阅专栏

脚本命令这里第一个参数是python脚本名称，第二个参数是json

spark-submit  --master yarn --deploy-mode cluster --num-executors 20 --executor-memory 8g --executor-cores 2 --conf spark.yarn.executor.memoryoverhead=4096 $1.py $2

python 脚本此脚本获取json传参并调用spark集群访问hive

from pyspark import SparkContext,SparkConf
import sys
conf = SparkConf().setAppName("lx1")
sc = SparkContext(conf=conf)

from pyspark.sql import HiveContext
import pandas as pd
sqlContext = HiveContext(sc)
import sys
print ('*********************************************')
#print (sys.argv[1])
import json
dt =sys.argv[1]+'}}'
print(dt)
#json.loads(dt)

data = sqlContext.sql("select area_no,ord from bcc.area")
print(data.columns)
print ('*********************************************')
#print ('jb', sys.argv[0])
for i in range(1, len(sys.argv)):
    print ("cs", i, sys.argv[i])
print('**********************************************')

data.show()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

张小竟

关注关注

3
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
spark提交python脚本并传参

脚本命令这里第一个参数是python脚本名称，第二个参数是jsonspark-submit --master yarn --deploy-mode cluster --num-executors 20 --executor-memory 8g --executor-cores 2 --conf spark.yarn.executor.memoryoverhead=4096 $1...
复制链接

扫一扫