用 Docker 搭建 Spark 集群

简介 Spark 是 Berkeley 开发的分布式计算的框架,相对于 Hadoop 来说,Spark 可以缓存中间结果到内存而提高某些需要迭代的计算场景的效率,目前收到广泛关注。 熟悉 Hadoop 的同学也不必担心,Spark 很多设计理念和用法都跟 Hadoop 保持一致和相似,并且在使用上完全兼容 HDFS。但是 Spark 的安装并不容易,依赖包括 Java、Scala、HD...
阅读(5259) 评论(0)
    个人资料
    • 访问:234773次
    • 积分:3336
    • 等级:
    • 排名:第9440名
    • 原创:102篇
    • 转载:0篇
    • 译文:1篇
    • 评论:47条
    最新评论