使用IntelliJ IDEA编写SparkPi直接在Spark中运行

最新推荐文章于 2024-09-10 16:15:11 发布

lqf1403

最新推荐文章于 2024-09-10 16:15:11 发布

阅读量7.6k

点赞数 4

分类专栏： machine learning Hadoop 文章标签： spark intellij idea scala idea sparkpi

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/GYQJN/article/details/49421789

版权

本文详细介绍了如何在IntelliJ IDEA中创建一个SparkTest工程，使用Scala编写SparkPi程序，并连接到Spark standalone集群进行运行。通过开启Spark，引入依赖，修改代码，打包JAR以及配置运行参数，最终成功运行程序并获取结果。

摘要由CSDN通过智能技术生成

使用IntelliJ IDEA编写Scala在Spark中运行

环境说明：hadoop-2.2.0+spark-1.1.0
hadoop是完全分布式，spark是standalone。在master节点master1上安装了IntelliJ IDEA。

1、开启spark

进入到spark的sbin目录,./start-all.sh命令开启spark。
注意：因为演示的是SparkPi demo，无需从hdfs读取数据，所以没有启动hadoop。可以根据需要启动hadoop。

2、在IntelliJ IDEA中新建SparkTest工程

将spark提供的SparkPi.scala文件中的内容拷贝到工程中（package语句除外）如下图所示。
这里写图片描述

2.1、在工程中引入spark-assembly-1.1.0-hadoop2.2.0.jar

“File”->”Project Structure”->”Libraries”->绿色加号->”java”,在弹出页面中到spark/lib目录下找到spark-assembly-1.1.0-hadoop2.2.0.jar，”OK”。如下图所示

最低0.47元/天解锁文章

lqf1403 CSDN认证博客专家 CSDN认证企业博客

码龄14年

35: 原创

18万+: 周排名

57万+: 总排名

24万+: 访问

: 等级

2778: 积分

45: 粉丝

129: 获赞

39: 评论

188: 收藏

私信

关注

热门文章

分类专栏

排序算法 4篇
java 13篇
个人 2篇
python 1篇
machine learning 1篇
linux 4篇
scala 2篇
Hadoop 18篇
Hbase 8篇
MapReduce 11篇
maven 1篇
mahout 1篇
Java混合编程 1篇
java设计模式 1篇
Hadoop源码 1篇
JVM
数据结构 3篇

最新评论

根据中序和先序(后序)构建二叉树
patback1: 看你这解答给我看笑了，专门回复一下。你中序和后序创建树的第三步就是个错的。你写的“在前序遍历中，大树的root的leftchild位于root之后，所以左子树的根节点为D。”现在只有中序和后续，哪里来的前序？如果你非要先重建左子树，那正确的逻辑是：中序左子树中的元素在后序序列中下标最大的元素是中序左子树的根。更方便的办法是先重建右子树，其逻辑是：在后序遍历中，右子树的根在整个树root之前，所以右子树的根节点为M。
先序遍历和后序遍历为什么不能唯一地确定一棵树？
江湖人称小鱼哥: 还有m叉树了，二叉树只是其中一部分
先序遍历和后序遍历为什么不能唯一地确定一棵树？
wangym1551: 二叉树不是树吗？
先序遍历和后序遍历为什么不能唯一地确定一棵树？
江湖人称小鱼哥: 博主你赶紧修改博客吧，你说的是二叉树，不是树，树根据先根和后根是可以确定的唯一一棵树
浅谈AdaBoost算法--附有详细示例解析
旺仔牛仔r: 我终于搞明白了！感谢分享！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。