关于搭建spark集群的方法请参考:
Hadoop集群搭建http://blog.csdn.net/u013468917/article/details/50965530
Spark集群搭建http://blog.csdn.net/u013468917/article/details/50979184
搭建好集群后就可以开始着手写一个“Hello World"了,当然对于Spark来说,所谓的”Hello World“程序就是WordCount。
运行环境说明:
系统:Ubuntu 12.04.5 LTS 64位
java版本:1.7.0_80
Hadoop版本:hadoop-2.2.0
Scala版本:2.10.1
Spark版本:spark-1.3.0
由于本人比较习惯用eclipse,所以本次WordCount是在eclipse下编写的,当然目前大部分开发者都比较推崇IntelliJ IDEA。可惜这个软件貌似很耗cpu,渣本难以承受。只好继续用回eclipse,尽管真的很慢。所以如果电脑配置的CPU是i5及以上,还是用IntelliJ比较好。
eclipse可以在官网下载,具体下载安装流程就不细表了。地址在这里: