7.在集群上运行Spark

用sbt打包Spark应用

sbt是一个比较新的Scala项目构建工具,与Maven功能类似,编写的Scala程序放在项目根目录/src/main/scala 目录下,要把所有依赖包打包在一个Jar包内(即assembly包)需要用到assembly插件。
可以安以下步骤构建:
1.在项目根目录下新建build.sbt文件 ,并输入以下内容:

第一行引入构建assembly包所需要的功能。
libraryDependencies ++=  ... 以组ID%包ID%包版本号 配置依赖的jar包,注意第一行配置Spark Jar包时 多了 %"provided" 用于指定Jar包作用范围,指定了provided打包时即排除这个jar包,因为Spark运行环境中已经有这些Jar包了。
2.在项目根目录/project 目录下新建 assembly.sbt文件并输入:
用于引入sbt-assembly插件
3.运行 sbt assembly 构建assembly Jar包,生成的Jar包在项目根目录/target/scala-xxx 下,名称为 my-project-assembly.jar(在第一步中配置的)
4.用spark-submit 提交应用,格式为:







评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值