6.824: Distributed Systems 课程讲义1

本文介绍了分布式系统的基本概念,探讨了为何采用分布式系统的原因,包括去连接物理实体、提高安全性、容错和横向扩展。主要话题涉及存储、通信和计算的抽象,以及分布式系统的实现、性能、容错和一致性问题。特别地,文章深入讲解了MapReduce模型,其目标是简化大规模数据处理,并隐藏分布式执行的复杂性。MapReduce通过Map和Reduce函数实现数据处理,具备良好的扩展性,但也面临性能、容错和一致性挑战。
摘要由CSDN通过智能技术生成

什么是分布式系统?

  • 多计算机协作
  • DNS,P2P的文件共享
  • 大型数据 MapReduce,以及很多的关键性基础架构都是分布式的。

为什么要分布式?

  • 去连接物理上分离的实体
  • 去通过隔离获得安全性
  • 去通过复制来容错
  • 去通过并行的CPU/mem/disk/net来达到横向扩展

但是这很复杂, 许多并发的组件,必须处理好部分组件失败的情况,也 很难去了解性能的瓶颈

MAIN TOPICS

关于抽象,就是隐藏了分布式应用程序的复杂性,有三大类抽象:

  • 存储
  • 通信
  • 计算

关于分布式有一堆topic被反复探究。

实现

  1. RPC
  2. 线程
  3. 并发控制

性能

期望得到可伸缩的吞吐量,N台 服务器通过并行的CPU,磁盘,网络提高N倍吞吐量,因此处理更高的负载只需要买更多的计算机,但是实际上扩展会变得越来越难,如何负载均衡,如何隐藏共享资源,如何处理无法并行处理的部分。

容错

1000台服务器,复杂的网络 总是会出现某些服务挂掉了,我们希望在应用程序程序隐藏这些失败的情况
我们通常希望用下面两个来度量:

  • 可用性 – 我可以一直使用我的文件无论是否失败
  • 持久性 – 当故障被修复了,我的文件可以继续使用

容错的思路:
通过副本服务器来解决

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值