Mit 6.824笔记(持续更新,欢迎指正)

本文介绍了分布式系统的概念,包括其原因、挑战、实验内容,重点探讨了MapReduce的原理及其在处理大数据计算中的应用。同时,文章强调了分布式系统中的性能、容错性和一致性问题,以及隐藏分布复杂性的接口抽象的重要性。
摘要由CSDN通过智能技术生成

Introduction

1.什么是分布式系统?

  • 核心:通过网络使一群计算机通过相互通信来完成一些连贯的任务。
  • 例子:存储为大网站或者大数据计算(MapReduce)以及点对点文件共享等等
  • 原因:许多关键的基础设施是分布式

2.为什么人们要构建分布式系统?(以此获得更高的性能)

  • 通过并行增加容量(Parallelism)
  • 通过复制来容忍错误(fault tolerance)
  • 使计算物理上接近外部实体(Physical)
  • 通过隔离实现安全(security / isolated)
    困难:
  • 并发编程和复杂的交互带来的各种问题(concurrency)
  • 故障模式、局部故障(partial failure)
  • 难以实现的性能潜力(performance)

3.实验

  • 实验1:MapReduce
  • 实验2:使用Raft进行容错复制
  • 实验3:容错键/值存储(K/V server)
  • 实验4:分片键/值存储(Shared K/V service)<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值