Spark Scala IntelliJ IDEA开发环境搭建（入门）

最新推荐文章于 2022-11-27 19:32:20 发布

说好的不搞IT_66

最新推荐文章于 2022-11-27 19:32:20 发布

阅读量1.9k

点赞数

分类专栏：大数据 spark scala 文章标签： spark scala intellij idea java idea

本文链接：https://blog.csdn.net/sdyb_yueding/article/details/78093453

版权

大数据同时被 3 个专栏收录

2 篇文章 0 订阅

订阅专栏

spark

1 篇文章 0 订阅

订阅专栏

scala

1 篇文章 0 订阅

订阅专栏

一、下载安装IntelliJ IDEA

https://www.jetbrains.com/idea/download

二、安装Scala插件
这里写图片描述
三、创建Maven工程

填写完GroupId，ArtifactId后填写工程名称，一直下一步，直到工程创建完成。

创建完成后目录结构如下图

工程目录结构

在main目录下面创建scala目录并设置为资源目录，网上很多教程说把多余的java目录删掉，其实没必要，有时我们开发spark时需要用到scala和java，java的代码可以写在原有的java目录下。

四、修改pom.xml文件

<dependencies>
    <!--scala项目需要-->
    <dependency>
      <groupId>org.scala-lang</groupId>
      <artifactId>scala-compiler</artifactId>
      <version>2.10.4</version>
      <scope>compile</scope>
    </dependency>
    <!--spark程序依赖-->
    <dependency>
      <groupId>org.apache.spark</groupId>
      <artifactId>spark-core_2.10</artifactId>
      <version>2.1.0</version>
    </dependency>
  </dependencies>
  <build>
    <plugins>
      <!--scala项目插件-->
      <plugin>
        <groupId>net.alchim31.maven</groupId>
        <artifactId>scala-maven-plugin</artifactId>
        <executions>
          <execution>
            <id>scala-compile-first</id>
            <phase>process-resources</phase>
            <goals>
              <goal>add-source</goal>
              <goal>compile</goal>
            </goals>
          </execution>
        </executions>
      </plugin>
    </plugins>
  </build>

五、代码编写运行

在scala目录下创建对应的包，然后创建scala类，注意：scala程序默认程序入口需要类是object，不然无法找到主类。

这里写图片描述

object ScalaTest {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf()
    conf.setAppName("WorkCount").setMaster("local[2]")
    val sc = new SparkContext(conf)
    val rdd = sc.textFile("E:\\abc.txt")
    rdd.flatMap(line => line.split(" ")).map(w =>
    (w,1)).reduceByKey((x,y) => x + 1).foreach(println)
  }
}

以上代码为spark单词统计例子，运行后可以看到结果如下

这里写图片描述