spark关联源码及远程调试设置

一。spark 关联源码

1.程序导入spark-assembly-1.6.1-hadoop2.6.0-cdh5.6.0 jar包后,

进入找到org-apache-spark,随便找到一个子类点开,


右上角attach sources 加载spark源码即可


二、spark远程调试

1.多窗口调试

 spark-submit --master spark://bihdp01:7077 --class SparkWordCount --executor-memory 1g --driver-java-options "-Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=y,address=10080" /data/cpp/testcpp1.jar (要打jar包)

显示:Listening for transport dt_socket at address: 10080

2> run-edit configurations-



3>.点击debug进行调试(ip和端口都要可以访问)



2.单窗口调试

在spark bin 文件下的spark-class文件中配置

添加:

export JAVA_OPTS="$JAVA_OPTS -Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=y,address=10000"


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 要对Spark程序进行远程提交和调试,需要按照以下步骤进行操作: 1. 确保本地和远程机器上都已经安装了Spark,并且版本相同。 2. 在本地机器上编写Spark程序,并将其打包成jar文件。 3. 将jar文件上传到远程机器上。 4. 在远程机器上启动Spark集群,并确保集群中的所有节点都已经启动。 5. 在远程机器上使用spark-submit命令提交Spark程序,指定jar文件的路径和程序的参数。 6. 在远程机器上使用Spark Web UI或者日志来监控程序的运行情况。 7. 如果需要调试程序,可以在程序中添加日志输出或者使用调试工具进行调试。 总之,远程提交和调试Spark程序需要注意版本兼容性、集群启动和程序参数等方面的问题,需要仔细操作才能保证程序的正确运行。 ### 回答2: IDEA是一种Java开发工具,支持Spark程序的开发和调试。通常情况下,开发人员需要在本地机器上安装Spark,并在本地运行程序以测试和调试程序。但是,当程序变得更加复杂和数据量更大时,本地运行可能变得困难。在这种情况下,远程提交Spark程序是一个更好的选择,这可以提高程序的运行效率,并在更大的数据量下进行测试和调试。 在IDEA中,可以使用远程提交Spark程序来启动集群中的Spark服务器并提交任务。要使用远程提交,需要在IDEA中创建一个Spark配置文件,并将其配置为Spark集群的地址和端口。然后,可以通过在IDEA中单击“运行”按钮来启动Spark服务器。该服务器将连接到Spark集群并启动应用程序。在IDEA中运行的远程Spark任务将在Spark集群上运行,而不是在本地机器上运行。 为了进行调试,可以在IDEA中配置Spark调试模式。将程序连接到远程Spark集群之后,可以设置调试断点,并通过IDEA的调试工具来监视变量和堆栈跟踪。这使得对Spark程序进行远程调试变得容易。同时,方便了集群环境下多个程序同时运行。 总的来说,在IDEA中使用远程提交和调试功能,可以更有效地测试和调试Spark程序。这种方法可以帮助开发人员在快速增长的数据量和复杂性中更好的创建Spark程序。 ### 回答3: Spark是一个开源的分布式计算框架,它提供了高效的数据处理能力和强大的分布式计算支持。然而,现实世界中,我们经常需要在开发环境之外的远程机器上进行Spark程序的开发和运行,因此需要通过远程提交和调试的方式来进行程序的部署和调试。 在这种情况下,我们可以使用idea来进行远程提交和调试Spark程序。首先,需要在远程机器上安装和配置Spark环境,包括配置Spark的路径、环境变量、Master和Worker节点等。在idea中,可以通过添加远程配置来设置远程机器的连接信息,并设置远程Spark的运行模式,如local模式或者standalone模式等。 接下来,需要在idea中创建一个Spark应用程序,并将其打包成jar包。然后,在idea中选择远程Run或Debug配置,并选择远程主机。在远程配置中,需要指定远程机器上的Spark的路径和环境变量等参数,并将打包好的jar包上传到远程机器上。 在进行远程调试时,可以在idea中设置断点,然后在远程机器上运行 Spark 集群,并运行远程调试。在远程调试控制台中,可以通过命令行方式运行 Spark 应用,并在 idea 中进行调试。此时,idea会自动连接到远程 Spark 应用程序,并将调试信息返回给本地 ide 控制台中。 总体而言,通过使用 idea 来进行远程提交和调试 Spark 程序的方法可以大大提高开发和部署的效率。但是需要注意的是,在使用远程方式进行开发和部署时,需要考虑到网络延迟、数据传输等因素,以便更好地运行和优化 Spark 应用程序。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值