这几年工作下来,一大感受,就是分布式系统这一块其实没有一个非常清晰的知识图谱,更多的是遇到了不同的问题,给出了不同的解决方案。我觉得要打好基础,还是要多读读原理性的文章,然后再结合现实中工程的项目来提升理论。
1. GFS。google三驾马车之一,分布式文件系统。毋庸置疑,这应该是分布式系统领域最经典的文章,几乎所有分布式、存储和大数据相关的topic都要提到它。
这里先推荐2个入门课程,MIT 6.824讲了分布式系统相关的基础,会布置大量的论文阅读,实验部分使用golang实现了Raft协议。CMU 15-721讲数据库实现的基础和关键技术,也会有大量论文阅读
1. https://pdos.csail.mit.edu/6.824/schedule.html
2. http://15721.courses.cs.cmu.edu/spring2018
最后列一下我觉得特别不错的几篇文章:
1. MapReduce: Simplified Data Processing on Large Clusters2. The Google File System
3. Bigtable: A Distributed Storage System for Structured Data.
后续针对这几篇文章再补一下自己的读后感。