6.824 Distributed Systems
文章平均质量分 93
未闻小然桑
咱的目标是星辰大海。。。
展开
-
Lecture 1: Introduction
1. 简介什么是分布式系统?多个相互协作的计算机DNS, P2P文件共享,大数据库, MapReduce, &c许多关键基础设施都是分布式的为什么使用分布式?为了连接物理上分隔的实体通过隔离来实现安全通过复制来容忍错误通过并行CPU/内存/磁盘/网络来提高吞吐量分布式存在的问题?复杂性:许多并发的实体必须处理局部故障充分发掘性能潜能的困难性(tricky to realize原创 2016-04-02 23:00:27 · 627 阅读 · 0 评论 -
案例学习: MapReduce
1. 准备工作: 阅读 MapReduce (2004)2. 主要内容MapReduce 可以很好的例证6.824 课程的主题(分布式系统), 而MR也将作为Lab1 的主题。2.1 MapReduce 概述上下文: 在多TB(multi-terabyte)数量级数据上的多小时(multi-hour)计算。 例如:当爬取的网页不是由分布式系统的爱好者开发的时候,那么对这些网页结构进行试验分析时会原创 2016-04-06 16:28:20 · 578 阅读 · 0 评论 -
Lecture 2: 基础结构: RPC and threads
6.824 2016 Lecture 2: Infrastructure: RPC and threadsMost commonly-asked question: Why Go? 6.824 used to use C++ students spent time fixing bugs unrelated to distributed systems e.g., th原创 2016-04-06 22:23:41 · 752 阅读 · 0 评论 -
Lab1: MapReduce
1. 前言1.1 课程框架代码下载git clone git://g.csail.mit.edu/6.824-golabs-2016 6.8242. Preamble: Getting familiar with the source3. Part I: Map/Reduce input and output4. Part II: Single-worker word count5. Part II原创 2016-04-10 11:27:44 · 1007 阅读 · 0 评论 -
CAP和BASE理论
1. CAP定理CAP理论告诉我们,一个分布式系统不可能同时满足一致性(C:Consistency),可用性(A:Availability)和分区容错性(P:Partition tolerance)这三个需求,最多只能同时满足其中的两项。 1.1 一致性在分布式环境中,一致性是指数据在多个副本之间是否能够保持一致的特性。在一致性的需求下,当一个系统在数据一致的状况下执行更新操作后,应该保持系统的原创 2016-05-16 12:49:51 · 673 阅读 · 0 评论