Scala | Spark基础入门 | IDEA配置 | 集群搭建与测试

幼稚的人呐

已于 2022-08-17 15:38:23 修改

阅读量881

点赞数

分类专栏： Spark 文章标签： spark scala java

于 2022-07-18 17:54:55 首次发布

本文链接：https://blog.csdn.net/liujiesxs/article/details/125847213

版权

文章目录

一、学习目标

在这里插入图片描述

二、本机开发–scala配置

1. 下载Scala

我这里选择的scala2.11.8
在这里插入图片描述

2. 安装scala

将下载的scala2.11.8的msi的文件剪切到指定文件夹D:\scala2.11.8
双击点击安装，一直点击next，或者同意协议，然后选择自己的安装目录

3. 配置Scala的系统环境变量

进入环境变量设置界面。
在这里插入图片描述
配置SCALA_HOME的地址；

添加到path；

验证是否安装成功；打开命令提示符输入scala，是否出现对应的版本号；

在这里插入图片描述

4. IDEA中的scala配置

新建一个java–spark的java项目
在这里插入图片描述

配置下载好的Scala-SDK

如果找不到Scala，查看IDEA安装完插件Scala后通过add frameworks support找到不到scala插件

因为不是maven模式，因此，需要拿到spark相应的jar包spark-2.3.1-bin-hadoop2.6/jars

下载地址：https://archive.apache.org/dist/spark/spark-2.3.1/

放置到项目下的lib文件夹中
在这里插入图片描述
此时，会加载这些jar包

搞定！！！

5.开发第一个项目wordcount

Wordcount.scala：

package com.shsxt.scala

import org.apache.spark.rdd.RDD
import org.apache.spark.{
   SPARK_BRANCH, SparkConf, SparkContext}

object Wordcount {
   
  //主入口程序
  def main(args: Array[String]): Unit = {
   
    //1.创建sparkconf对象，针对此对象，配置改spark应用的配置信息
    val conf = new SparkConf()
    //setAppName:设置spark应用程序在运行时的任务名称
    //setMaster：设置app的运行模式，本地模式设置为local即可
    conf.setAppName("wordcount").setMaster("local")
    //SparkContext是spark应用程序的所有入口
    val sc = new SparkContext(conf)

    //2.读取数据源文件
    val line: RDD[String] = sc.textFile("data/word.txt")
    //将数据分割并且一对多映射关系
    val word: RDD[String] =