scala读取本地hdfs_IDEA编写wordcount，读取hdfs文件，运行在Spark集群例子

最新推荐文章于 2021-11-19 15:23:57 发布

笨zhu

最新推荐文章于 2021-11-19 15:23:57 发布

阅读量587

点赞数

文章标签： scala读取本地hdfs

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_28362173/article/details/112019210

版权

本文介绍如何在IDEA中使用Scala编写WordCount程序，读取HDFS文件，并在Spark集群上运行。首先确保安装了hadoop和spark集群，接着在IDEA中编写并打包Scala程序，通过maven的clean和package命令生成jar包。然后启动集群，将数据上传至HDFS，最后使用`spark-submit`提交任务并检查结果。

摘要由CSDN通过智能技术生成

IDEA编写wordcount，读取hdfs文件，运行在Spark集群例子

发布时间：2018-10-31 10:10,

浏览次数：822

, 标签：

IDEA

wordcount

hdfs

Spark

前期：已安装好hadoop集群和spark集群，hadoop2.6.5，spark2.3.1，jdk1.8. scala2.1.0

第一步：在idea编写scala程序，并且要打包(pom文件的build标签中配置好maven打包代码，可以定义主类也可以在提交的时候再定义){补充：可以在spark本地调试程序，新建一个application，添加代码主类，program

arguments可以添加传入的参数}

maven打包在：veiw-->Tool Windows-->Maven Projects打开窗口点击clean，再点击package打好jar包

第二步：启动hadoop和spark集群，将数据传到hdfs上。

第三步：将打好的jar包上传到集群上，使用spark-submit提交任务

spark-submit --class wang.SparkWC --executor-memory 512m

--total-executor-cores 2 /root/Download/SparkTest-1.0-SNAPSHOT.jar

hdfs://wang-one/user/data/in.txt/ hdfs://wang-one/user/output

spark-submi

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
scala读取本地hdfs_IDEA编写wordcount，读取hdfs文件，运行在Spark集群例子

IDEA编写wordcount，读取hdfs文件，运行在Spark集群例子发布时间：2018-10-31 10:10,浏览次数：822, 标签：IDEAwordcounthdfsSpark前期：已安装好hadoop集群和spark集群，hadoop2.6.5，spark2.3.1，jdk1.8. scala2.1.0第一步：在idea编写scala程序，并且要打包(pom文件的build标签中配置...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。