比Hadoop更小巧的一个分布式计算框架,基于内存。很方便的在python中使用.刚刚开始用。在这里记录一下使用spark的旅程。 转载于:https://my.oschina.net/errord/blog/179689