pyspark 自定义分区实操

最新推荐文章于 2024-07-20 00:19:59 发布

@小时候可乖了@

最新推荐文章于 2024-07-20 00:19:59 发布

阅读量1.6k

点赞数

分类专栏： spark 文章标签： python spark 大数据

本文链接：https://blog.csdn.net/mostermoonsky/article/details/112426185

版权

在pycharm中编写如下代码：

from pyspark import SparkConf,SparkContext


def MyPartitioner(key):  #自定义分区函数
    print('MyPartitioner is running')
    print('the key is %d'%key)
    return key%

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

@小时候可乖了@

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
pyspark 自定义分区实操

在pycharm中编写如下代码：from pyspark import SparkConf,SparkContextdef MyPartitioner(key): #自定义分区函数 print('MyPartitioner is running') print('the key is %d'%key) return key%10 #设定分区取值方式def main(): print('the main function is running') c
复制链接

扫一扫