第9课:详解 IntelliJ IDEA下的Spark程序开发

本文详细介绍了在IntelliJ IDEA中开发Spark程序的步骤,包括安装配置、设置JDK和Scala、添加Spark库依赖,以及本地与集群程序的区别。讨论了为何不能直接在IDE中发布程序到集群,并讲解了如何在IDEA上打包程序以及在生产环境中的提交方式。
摘要由CSDN通过智能技术生成

第一步:下载安装包 Windows下最新的ideaIC-2016.2.2.exe

第二步:本地java8 和Scala 2.11.8软件套件的安装

第三步:为IDEA安装Scala这个过程是IDEA自动化的插件管理,所以点击后会自动下载

第四步:指定JDK1.8.x和Scala 2.10.4

第五步:通过选择File -> Project Stucture来设置工程的Libraries,核心是添加Spark的jar

第六步:添加Spark的jar依赖

本地 和 集群 的程序区别:
1.本地添加 conf.setMaster(“local”)
2.val lines = sc.textFile(“hdfs://Master:9000/README”)读取地址不同

为什么不能IDE集成开发环境中直接发布Spark程序到Spark集群上
1.内存和Core的限制,默认情况下Spark程序的Driver会在提交Spark程序的机器上,所以如果在IDE中提交程序的话,那IDE机器就必须非常强大
2.Driver 要指挥 Workers的运行并频繁的发生通信,如果开发环境IDE和Spark集群不在同一个网络下,就会出现任务丢失,运行缓慢等多种不必要的问题
3.这是不安全的

在IDEA上打包程序的过程
File - project structure - Artifacts - Jar - FromModuleWithDependencies - Mainclass

Buid - Build Artifacts - Build

特别注意:把Spark和Scala的jar去掉
会在系统集群上寻找,减少包大小

在生产环境下一定是通过写自动化shell脚本来自动

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值