前言
学习任何一门语言,都是从helloword开始,对于大数据框架来说,则是从wordcount开始,spark也不例外,作为一门大数据处理框架,在系统的学习spark之前,让我们先从一个wordcount开始吧!
环境准备说明
Spark 由 Scala 语言开发的,所以本课件接下来的开发所使用的语言也为 Scala ,咱们当 前使用的 Spark 版本为 3.0.0 ,默认采用的 Scala 编译版本为 2.12 ,所以后续开发时。我们依 然采用这个版本。开发前请保证 IDEA 开发工具中含有 Scala