java启动spark作业_关于在集群上运行spark作业的说明(AWS)

我有一个在AWS EC2机器上运行的HortonWorks集群,我希望使用火花流运行一个火花工作,这将吞下关于权力游戏的推文 . 在尝试在我的集群上运行它之前,我确实在本地运行它 . 代码正常,这里是:

import org.apache.spark.streaming.{StreamingContext, Seconds}

import org.apache.spark.streaming.twitter._

import org.apache.spark.{SparkConf, SparkContext}

object Twitter_Stream extends App {

val consumerKey = "hidden"

val consumerSecret = "hidden"

val accessToken = "hidden"

val accessTokenSecret = "hidden"

val sparkConf = new SparkConf().setAppName("GotTweets").setMaster("local[2]")

val ssc = new StreamingContext(sparkConf, Seconds(1))

val myStream = TwitterUtils.createStream(ssc, None, Array("#GoT","#WinterIsHere","#GameOfThrones"))

val rddTweets = myStream.foreachRDD(rdd =>

{

rdd.take(10).foreach(println)

})

ssc.start()

ssc.awaitTermination()

}

我的问题更准确地说是这个特定的代码行:

val sparkConf = new SparkConf().setAppName("GotTweets").setMaster("local[2]")

我将“local [2]”替换为“spark:// ip-address-EC2:7077”,它对应于我的一台ec2机器,但是连接失败了 . 我确定7077端口在这台机器上是打开的 .

此外,当我在我的一台EC2机器上使用此配置(setMaster(“local [2]”))运行此代码时,我的spark会使用群集中的所有机器还是仅在一台机器上运行?

这里例外:

17/07/24 11:53:42 INFO AppClient $ ClientEndpoint:连接到主火花:// ip-adress:7077 ... 17/07/24 11:53:44 WARN AppClient $ ClientEndpoint:连接失败master ip-adress:7077 java.io.IOException:无法连接到org.apache的org.apache.spark.network.client.TransportClientFactory.createClient(TransportClientFactory.java:216)中的spark:// ip-adress:7077位于org.apache.spark.rpc.netty.Outbox的org.apache.spark.rpc.netty.NettyRpcEnv.createClient(NettyRpcEnv.scala:200)的.spark.network.client.TransportClientFactory.createClient(TransportClientFactory.java:167) $ anon $ 1.call(Outbox.scala:187)at org.apache.spark.rpc.netty.Outbox $$ anon $ 1.call(Outbox.scala:183)at java.util.concurrent.FutureTask.run(FutureTask .java:266)java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)at java.util.concurrent.ThreadPoolExecutor $ Worker.run(ThreadPoolExecutor.java:617)at java.lang.Thread.run( Thread.java:748)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值