hadoop运行java程序命令_hadoop – 如何从命令行运行Spark-java程序

最新推荐文章于 2022-03-17 15:45:02 发布

刘昌睿

最新推荐文章于 2022-03-17 15:45:02 发布

阅读量108

点赞数

文章标签： hadoop运行java程序命令

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31901801/article/details/114618997

版权

从say：

https://github.com/holdenk/fastdataprocessingwithsparkexamples/tree/master/src/main/scala/pandaspark/examples获取wordcount示例.

请按照以下步骤创建胖jar文件：

mkdir example-java-build/; cd example-java-build

mvn archetype:generate \

-DarchetypeGroupId=org.apache.maven.archetypes \

-DgroupId=spark.examples \

-DartifactId=JavaWordCount \

-Dfilter=org.apache.maven.archetypes:maven-archetype-quickstart

cp ../examples/src/main/java/spark/examples/JavaWordCount.java

JavaWordCount/src/main/java/spark/examples/JavaWordCount.java

您添加了相关的spark-core和spark示例依赖项.确保您具有基于您的spark版本的依赖项.我使用spark 1.1.0,因此我有相关的依赖项.

我的pom.xml看起来像这样：

junit

junit

3.8.1

test

org.apache.spark

spark-examples_2.10

1.1.0

org.apache.spark

spark-core_2.10

1.1.0

使用mvn构建jar文件.

cd example-java-build/JavaWordCount

mvn package

这会在目标目录中创建fat jar文件.

将jar文件复制到服务器上的任何位置.

转到火花的bin文件夹. (在我的情况下：/root/spark-1.1.0-bin-hadoop2.4/bin)

提交火花工作：我的工作看起来像这样：

./spark-submit --class "spark.examples.JavaWordCount" --master yarn://myserver1:8032 /root/JavaWordCount-1.0-SNAPSHOT.jar hdfs://myserver1:8020/user/root/hackrfoe.txt

这里–class是：你的应用程序的入口点(例如org.apache.spark.examples.SparkPi)

–master：集群的主URL(例如spark：//23.195.26.187：7077)

最后一个参数是您为程序选择的任何文本文件.

输出应该是这样的,给出文本文件中所有单词的字数.

in: 17

sleeping.: 1

sojourns: 1

What: 4

protect: 1

largest: 1

other: 1

public: 1

worst: 1

hackers: 12

detected: 1

from: 4

and,: 1

secretly: 1

breaking: 1

football: 1

answer.: 1

attempting: 2

"hacker: 3

希望这可以帮助！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop运行java程序命令_hadoop – 如何从命令行运行Spark-java程序

从say：https://github.com/holdenk/fastdataprocessingwithsparkexamples/tree/master/src/main/scala/pandaspark/examples获取wordcount示例.请按照以下步骤创建胖jar文件：mkdir example-java-build/; cd example-java-buildmvn arch...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。