Scala2.11.8 + Sbt + Maven + IntelliJ Idea + Spark2.0开发环境搭建备忘

已有hadoop yarn 和 spark 集群部署、运行在分布式环境中,程序开发编码在PC上,由于逐渐增多scala编写spark2.0程序,入乡随俗使用sbt和IntelliJ Idea,顺便对PC上的Scala + sbt + maven + IntelliJ Idea一些要注意的开发环境配置细节进行记录,侧重于现在网上比较少总结又可能让人有些困扰的部分,目前这方面总结比较完整的文章好像还比较少(也可能是自己看的不够多),有些内容也是google国外和自己摸索的,在此进行记录,一方面方便跟可能有同样需求的程序猿们讨论交流,一方面给做个备忘记录。


整体上主要是以下几个步骤。

1. Java JDK 安装与配置

2. Scala2.11.8 安装与配置

3. maven 安装与配置设置文件

4. sbt 安装与配置sbt-lauch.jar包

5. 集成开发环境IDE IntelliJ Idea 安装与配置插件

6. 通过sbt依赖创建 Spark2.0 项目


1. Java JDK 安装与配置

官网下载对应操作系统的安装包,做好环境变量配置,命令行java 相关命令成功执行,网上很多参考文档,不多叙述。


2. Scala 安装与配置

官网下载对应操作系统的安装包,做好环境变量配置,命令行scala相关命令成功执行,网上很多参考文档,不多叙述。


3. maven 安装与配置设置文件

maven或sbt等开发管理软件的使用,在开发中能够较为系统的生成开发目录结构,管理依赖关系,帮开发人员节省时间,提高效率,当然具体使用与否还是看个人实际开发情况选择,没有maven或sbt等管理软件也可以照样开发。

官网下载对应操作系统的安装包,解压到自己设定的目录,成功执行mvn相关命令。

(1)由于国内连接默认maven仓库,网络状况和速度是个老大难问题,可以在maven目录下conf/settings.xml文件配置修改<mirrors></mirrors>部分,查找并增加国内外的当时仍有效的快速maven仓库镜像,比如阿里云的maven仓库镜像。先备份原有settings.xml文件,再如下修改当前settings.xml。

<mirror> 

    <id>nexus-aliyun</id>

    <name>Nexus aliyun</name>

    <url>http://maven.aliyun.com/nexus/content/groups/public</url> 

    <mirrorOf>central</mirrorOf> 

</mirror>

(2)本地下载保存依赖的目录路径,默认是.m2下面(Linux用户家目录里面,Windows C盘用户目录里面),可以改为其他指定目录,修改conf/settings.xml文件,<localRepository>修改为指定路径</localRepository>,以防在用户目录下被误删或受到其他影响。

(3)这时候没有安装IDE,可以通过mvn命令生成maven项目,修改pom.xml,管理项目依赖包,进行代码编写,编辑器自选。


4. sbt 安装与配置sbt-lauch.jar包

为了进行

  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: Spark本地开发环境搭建需要以下步骤: 1. 安装Java JDK和Scala:首先需要安装Java JDK和Scala,可以从官网下载安装包进行安装。 2. 安装MavenMaven是一个项目管理工具,可以从官网下载安装包进行安装。 3. 下载Spark:从官网下载Spark的二进制包,解压到本地目录。 4. 配置环境变量:将Java、ScalaMaven的bin目录添加到系统环境变量中。 5. 配置Spark:在Spark的conf目录下,将spark-env.sh.template文件复制一份并重命名为spark-env.sh,然后编辑该文件,设置JAVA_HOME、SCALA_HOME和SPARK_HOME等环境变量。 6. 编写Spark应用程序:使用Scala或Java编写Spark应用程序,并使用Maven进行依赖管理和打包。 7. 运行Spark应用程序:使用spark-submit命令提交Spark应用程序,即可在本地运行Spark应用程序。 以上就是Spark本地开发环境搭建的步骤。 ### 回答2: Spark是一个用于大数据处理的强大框架,但在开始实际工作之前,首先需要为Spark构建本地开发环境。在本文中,我将向您介绍如何搭建基于MavenScala和Java的本地Spark开发环境。 第一步:安装Java Spark依赖于Java进行开发和运行。因此,必须先安装Java。您可以从Oracle官网下载Java JDK。安装完成后,请确保已将JAVA_HOME环境变量设置为JDK的安装路径。 第二步:安装Scala Scala是一种支持面向对象和函数式编程的高级编程语言。在Spark开发中,Scala最常用。要安装Scala,请按照Scala官方安装指南安装Scala,并将其放入系统路径中。 第三步:安装Maven Maven是Java项目的依赖管理器。它可以下载项目所需的所有依赖项,并将它们自动放置在项目的类路径下,以加速开发和构建过程。请前往Maven官方网站下载并安装Maven,并将其添加到系统路径中。 第四步:下载SparkSpark官网下载Spark。解压缩下载的Spark二进制文件并将其放入系统路径中。 第五步:创建示例应用程序 在本地实例中创建一个Spark示例应用程序。为此,首先创建一个Maven项目,并将以下依赖项添加到项目的POM.xml文件中: ``` <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.10</artifactId> <version>1.6.1</version> </dependency> ``` 使用Scala创建Spark应用程序,并将其保存在src/main/scala目录下: ``` import org.apache.spark.{SparkConf, SparkContext} object ExampleApp { def main(args: Array[String]) { val conf = new SparkConf().setAppName("ExampleApp").setMaster("local[2]") val sc = new SparkContext(conf) val data = Array(1, 2, 3, 4, 5) val rdd = sc.parallelize(data) val result = rdd.reduce(_ + _) println(result) sc.stop() } } ``` 第六步:构建项目 使用Maven进行构建,编译并将项目打包成jar文件。要构建项目,请在项目根目录下运行以下命令: ``` mvn package ``` 第七步:运行Spark应用程序 在项目目录中,使用以下命令运行Spark应用程序: ``` ./bin/spark-submit --class ExampleApp target/ExampleApp-1.0-SNAPSHOT.jar ``` 恭喜!你已经成功地创建了一个基于MavenScala和Java的本地Spark开发环境。现在您可以使用您的Spark应用程序和环境去探索和开发更多有趣的大数据应用程序。 ### 回答3: Spark是一个专门针对大规模数据处理的计算引擎,其本身需要依赖于Java和Scala等编程语言来实现数据处理的应用,因此需要在本地搭建开发环境来进行Spark开发。 以下是搭建Spark本地开发环境的步骤: 第一步:安装Java开发环境(JDK) 在Spark中,需要使用Java 8或更高版本,因此需要在本地安装Java开发环境。为了避免不同版本之间的冲突,建议使用Oracle JDK。 第二步:安装Scala ScalaSpark的支持语言之一,因此需要安装Scala。你可以在Scala官网上选择合适的版本来进行安装。安装Scala之后可以使用命令行来测试Scala是否成功。 第三步:安装Maven Maven是一个项目管理和构建工具,用于处理依赖关系,并生成可执行的Jar包。在Spark开发过程中通常使用Maven进行依赖管理和打包。你可以在Maven官网上下载安装包,安装完成后可使用命令行测试Maven是否成功。 第四步:安装Spark 安装Spark需要先下载Spark源代码包,选择合适的版本进行下载,并解压缩。之后在命令行中输入mvn package -DskipTests来构建Spark。构建完成后即可在target文件夹下找到生成的Spark应用包。 第五步:验证安装 在安装完成后,可以使用IDE(如IntelliJ IDEA)或者命令行来验证是否安装成功。在IDE中,可以创建一个Scala项目并导入Spark的相关依赖后,编写Spark应用程序来进行测试。在命令行中,可以使用spark-shell命令进入交互模式来执行Spark相关命令,验证是否成功。 总结: 以上就是Spark本地开发环境搭建的步骤。虽然过程比较繁琐,但只需要按照以上步骤进行安装,就能轻松地搭建起一个Spark本地开发环境。在上述环境下,你可以进行Spark开发和调试,处理大规模数据集。最后需要提醒注意的是,为了保证Spark应用程序能够正常运行,需要根据实际需要选择适当的硬件和软件资源。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值