- 博客(3)
- 资源 (6)
- 收藏
- 关注
原创 Alluxio简介 & 在Alluxio上运行Spark与MapReduce
Alluxio简介Alluxio是一个基于内存的分布式文件系统,它是架构在底层分布式文件系统和上层分布式计算框架之间的一个中间件,主要职责是以文件形式在内存或其它存储设施中提供数据的存取服务应用场景 在大数据领域,最底层的是分布式文件系统,如Amazon S3、Apache HDFS等,而较高层的应用则是一些分布式计算框架,如Spark、MapReduce、HBase、Flink等,这些分布式框架
2017-11-10 18:44:10 1340
原创 Spark 2.2源码编译 & 支持hadoop-2.6.0-cdh5.7.0
JDK & Maven & Scala & Git软件安装 & 前置准备Spark 2.2.0源码的下载地址: https://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-2.2.0/spark-2.2.0.tgz编译Spark源码的文档(参考官方文档): http://spark.apache.org/docs/latest/building
2017-11-09 22:45:14 4088
hadoop2.7.3 自定义实现机架感知(Java版本)
2017-04-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人