首先parallelize和makeRDD的区别:makeRDD有两种实现,一种调用parallelize,另一个为数据提供了位置信息。原文解说:
http://www.iteblog.com/archives/1512
其中spark的conf目录下Metrics文件,是一个检测系统的配置文件,可以在这个配置文件中配置其他监控系统如:ganglia
以下链接是配置ganglia步骤:http://www.iteblog.com/archives/1347
了解源码的话:http://blog.csdn.net/huwenfeng_2011/article/details/43370959