Tachyon
是一个分布式内存文件系统,可以在集群里以访问内存的速度来访问存在tachyon里的文件。把Tachyon是架构在最底层的分布式文件存储和上层的各种计算框架之间的一种中间件。主要职责是将那些不需要落地到DFS里的文件,落地到分布式内存文件系统中,来达到共享内存,从而提高效率。同时可以减少内存冗余,GC时间等。
为了更好地在Spark中使用tachyon,于是对tachyon源码进行了重新编译,还是非常简单的。
Spark强大的框架,通过源码的学习分析将为后续利用Spark提供基础平台。