eclipse怎么用java写spark_eclipse下进行spark开发（已实践）

最新推荐文章于 2021-11-16 11:38:51 发布

立·波

最新推荐文章于 2021-11-16 11:38:51 发布

阅读量202

点赞数

文章标签： eclipse怎么用java写spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36255898/article/details/114894852

版权

开发准备：

jdk1.8.45

spark-2.0.0-bin-hadoop2.7(windows下和linux个留一份)

Linux系统(centos或其它)

spark安装环境

hadoop-2.7.2(linux一份)

Hadoop安装环境

开发环境搭建步骤如下：

1. 下载scala-SDK-4.4.1-vfinal-2.11-win32.win32.x86_64.tgz

2. 解压压缩包，直接运行里面的eclipse

3. 创建scala project，并创建scala类WordCount

4. 右键工程属性，添加spark-2.0.0-bin-hadoop2.7下面所有的库，可自定义库放进来：

5. 编辑代码如下：

import org.apache.spark._

import SparkContext._

object WordCount {

def main(args: Array[String]) {

if (args.length != 3 ){

println("usage is org.test.WordCount ")

return

}

val sc = new SparkContext(args(0), "WordCount",

System.getenv("SPARK_HOME"), Seq(System.getenv("SPARK_TEST_JAR")))

val textFile = sc.textFile(args(1))

val result = textFile.flatMap(line => line.split("\\s+"))

.map(word => (word, 1)).reduceByKey(_ + _)

result.saveAsTextFile(args(2))

}

}

6. 右键类，导出jar文件：

7. 在spark部署路径执行(可以通过spark的日志找到spark的master地址)：

./spark-submit --num-executors 1 --executor-memory 1g --class WordCount --master spark://10.130.41.59:7077 spark-wordcount-in-scala.jar spark://10.130.41.59:7077 hdfs://hadoop:9000/user/hadoop/input hdfs://hadoop:9000/user/hadoop/outspark

8. 参数解析：

可以执行./spark-submit --help获得帮助

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
eclipse怎么用java写spark_eclipse下进行spark开发（已实践）

开发准备：jdk1.8.45spark-2.0.0-bin-hadoop2.7(windows下和linux个留一份)Linux系统(centos或其它)spark安装环境hadoop-2.7.2(linux一份)Hadoop安装环境开发环境搭建步骤如下：1.下载scala-SDK-4.4.1-vfinal-2.11-win32.win32.x86_64.tgz2. 解压压缩包，直接运行里面的e...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。