IDEA的spark环境搭建运行WordCount

最新推荐文章于 2023-10-09 16:33:59 发布

代码非空

最新推荐文章于 2023-10-09 16:33:59 发布

阅读量367

点赞数

文章标签： spark intellij-idea scala

本文链接：https://blog.csdn.net/m0_65328677/article/details/127761809

版权

总结:需要用到的软件:JDK1.8,Maven,IDEA,scala,spark,hadoop,winutils,scala插件,pom依赖

1,安装JDK1.8,配置好环境变量
2,安装Maven,配置好环境变量
3,安装IDEA

4,安装scala   版本2.12.12   .tar.gz  解压免安装
下载地址:https://www.scala-lang.org/  
解压配置环境变量key=SCALA_HOME value=安装地址
path %SCALA_HOME%\bin
scala -version  版本查看

5,下载spark   版本2.12.12  .tar.gz  解压免安装
下载地址:https://archive.apache.org/dist/spark/spark-2.3.3/
配置环境变量

6,安装hadoop   版本2.7.0  .tar.gz  解压免安装
下载地址:https://archive.apache.org/dist/hadoop/common/hadoop-2.7.0/
解压配置环境变量key=HADOOP_HOME value=安装地址
path %HADOOP_HOME%\bin

7,下载winutils   版本hadoop-3.0.0/bin  
下载地址:https://gitcode.net/mirrors/steveloughran/winutils?utm_source=csdn_github_accelerator
将bin替换原来Hadoop中的bin
CMD命令中运行  运行spark-shell    是否出现spark图标出现后则安装成功

8,IDEA插件市场中安装Scala插件,JDK配置好1.8,Maven路径选择好
9,Project Structure-Global Libraries-配置scala sdk
10,创建maven工程,设置groupId(WODS)和artifactId(WordCount),右键工程-Add Framework Support-添加scala框架
11,在src文件夹中创建一个WordCount文件夹并右键设定为source root
12,在WordCount中新建package(com.spark)和scala程序

13,scala程序
object HelloObject{
  def main(args:Array[String]){
    println("hello scala china!");
  }
}

14,pom.xml中添加
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>
    <groupId>WODAS</groupId>
    <artifactId>WordCount</artifactId>
    <version>1.0-SNAPSHOT</version>
    <properties>
        <spark.version>2.1.0</spark.version>
        <scala.version>2.11</scala.version>
    </properties>
    <repositories>
        <repository>
            <id>nexus-aliyun</id>
            <name>Nexus aliyun</name>
            <url>http://maven.aliyun.com/nexus/content/groups/public</url>
        </repository>
    </repositories>
    <dependencies>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_${scala.version}</artifactId>
            <version>${spark.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-streaming_${scala.version}</artifactId>
            <version>${spark.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-sql_${scala.version}</artifactId>
            <version>${spark.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-hive_${scala.version}</artifactId>
            <version>${spark.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-mllib_${scala.version}</artifactId>
            <version>${spark.version}</version>
        </dependency>
    </dependencies>
    <build>
        <plugins>
            <plugin>
                <groupId>org.scala-tools</groupId>
                <artifactId>maven-scala-plugin</artifactId>
                <version>2.15.2</version>
                <executions>
                    <execution>
                        <goals>
                            <goal>compile</goal>
                            <goal>testCompile</goal>
                        </goals>
                    </execution>
                </executions>
            </plugin>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.6.0</version>
                <configuration>
                    <source>1.8</source>
                    <target>1.8</target>
                </configuration>
            </plugin>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-surefire-plugin</artifactId>
                <version>2.19</version>
                <configuration>
                    <skip>true</skip>
                </configuration>
            </plugin>
        </plugins>
    </build>
</project>