pyspark运行wordcount程序报错:TypeError: ‘JavaPackage‘ object is not callable

Milv_xx

已于 2023-09-27 11:50:21 修改

阅读量1.1k

点赞数 7

文章标签： python spark 大数据

于 2023-09-27 11:48:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Milv_xx/article/details/133345469

版权

运行环境:

- spark3.2.4

- hadoop3.2.3

- jdk1.8

-python3.10

-py库 pyspark3.4.1

-vscode

源代码程序:

# coding:utf8
from pyspark import SparkConf, SparkContext

if __name__ == '__main__':
    conf = SparkConf().setMaster("local[*]").setAppName("WordCountHelloWorld")
    # 构建SparkContext对象
    sc = SparkContext(conf=conf)

    # 需求:wordcount单词计数
    # 读取文件
    file_rdd = sc.textFile("hdfs://hadoop102:8020/input/hello.txt")

    # 对单词进行切割
    words_rdd = file_rdd.flatMap(lambda line: line.split(" "))

    # 将单词转换为元组对象, key是单词, value是数字1
    words_with_one_rdd = words_rdd.map(lambda x : (x, 1))

    # 将元组的value 按照 key 分组, 对所有的value执行聚合操作(相加)
    result_rdd = words_with_one_rdd.reduceByKey(lambda a, b: a + b)

    # 通过collect方法收集RDD数据
    print(result_rdd.collect())

报错:

第20行

TypeError: 'JavaPackage' object is not callable

解决方案:

由于当前pyspark库最新版本3.4.1(2023/9/27已更新至3.5.0)不兼容

对pyspark进行降级即可

pip install pyspark==3.2.0

成功运行:

关注

7
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Milv_xx CSDN认证博客专家 CSDN认证企业博客

码龄2年

9: 原创

133万+: 周排名

10万+: 总排名

7694: 访问

: 等级

196: 积分

80: 粉丝

101: 获赞

14: 评论

138: 收藏

私信

关注

热门文章

最新评论

WSL + Vscode一站式搭建Hadoop伪分布式 + Spark环境
wawa901: 我找不到作者说的版本
WSL + Vscode一站式搭建Hadoop伪分布式 + Spark环境
wawa901: 下载的版本必须相同吗？
[算法] 简述快排和归并算法
CSDN-Ada助手: 推荐算法技能树：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
[操作系统] 信号量与同步问题(semaphore & synchronization)
CSDN-Ada助手: 恭喜您发布了关于信号量与同步问题的博客！这是一个非常重要且复杂的主题，您的解释肯定会对读者有很大帮助。接下来，如果可能的话，我建议您可以深入探讨一些实际应用场景，比如在操作系统中如何使用信号量来解决资源竞争的问题等等。期待看到更多精彩内容，加油！
[操作系统] 同步与互斥锁问题
CSDN-Ada助手: 恭喜您写了第6篇博客！标题看起来很有深度，同步与互斥锁问题是一个非常重要的话题。希望您能继续保持创作的热情和努力，为读者带来更多有价值的内容。或许下一步可以深入探讨一些实际案例，或者结合代码示例进行更具体的讲解，这样读者们会更易于理解和吸收。期待您的下一篇作品！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。