背景几乎所有编程语言的第一个程序都是 Hello World。
下载并安装JDK、Scala、Maven之前的Hadoop HA 和 Spark集群的文章中已经安装过JDK、Scala。Maven安装也很简单,略。
下载Idea并安装Scala插件在线安装有点慢,但网上很多方法解决,略。
创建一个maven-scala工程
按向导一步步填写、下一步。
修改pom.xml文件中的版本号将scala.version修改成本机安装的Scala版本,并加入hadoop以及spark所需要的依赖,完整的内容如下:
4.0.0
com.gemantic.bigdata
bigdata-spark
1.0-SNAPSHOT
2008
1.7
1.7
2.11.4
2.0.0
2.11
1.2.2
2.6.0
compile
scala-tools.org
Scala-Tools Maven2 Repository
http://scala-tools.org/repo-releases
scala-tools.org
Scala-Tools Maven2 Repository
http://scala-tools.org/repo-releases
org.scala-lang
scala-library
${scala.version}
junit
junit
4.4
test
org.specs
specs
1.2.5
test
org.apache.commons
commons-lang3
3.0
org.apache.hadoop
hadoop-hdfs
${hadoop.version}
org.apache.hadoop
hadoop-common
${hadoop.version}
org.apache.spark
spark-core_${spark.artifact}
${spark.version}
${dependency.scope}
org.apache.spark
spark-sql_${spark.artifact}
${spark.version}
${dependency.scope}
org.apache.spark
spark-hive_${spark.artifact}
${spark.version}
${dependency.scope}
org.apache.spark
spark-mllib_${spark.artifact}
${spark.version}
${dependency.scope}
org.apache.spark
spark-streaming-kafka-0-8_2.11
${spark.version}
${dependency.scope}
src/main/scala
src/test/scala
org.scala-tools<