1:打开IDEA先安装scala 插件 ---》File--Settings--Plugins--搜索scala 安装后关闭IDEA重启后如下图
2:新建Scala项目 File--New--Project--选择Scala--SBT
3:注意版本号的选择--点击finish就构建好了基本scala结构
在这里插一句话如果要是和Spark联合使用那么版本号很重要!!!可以查阅spark官网来看spark-scala的匹配版本号我的spark是2.2.0所以匹配的是2.11
打开新建的项目配置build.sbt文件
新建WorldCount :main下的scala--右键new--ScalaClass
写代码:
import org.apache.spark.{SparkConf, SparkContext}
object WorldCount {
def main(args: Array[String]) {
val conf=new SparkConf().setAppName("wordcount")
val sc=new SparkContext(conf)
val input=sc.textFile("/test/helloSpark.txt")
val lines=input.flatMap(line=>line.split(" "))
val count=lines.map(word=>(word,1)).reduceByKey{case (x,y)=>x+y}
val output=count.saveAsTextFile("/test/helloSparkRes")
}
}
打jar包File--project structure
上图第一个框为项目;第二个为类;第三个为去除jar包至提取核心代码
把jar包考入spark集群中
jar包位置在你的项目路径out下
加入你已经搭建好了spark集群(scala2.11+spark2.2.0)
./start-master.sh
./spark-class org.apache.spark.deploy.worker.Worker spark://Master:7077
spark-submit --master spark://Master:7077 --class WorldCount /test/spark/untitled1.jar