大型互联网技术架构3-分布式存储-I

本文深入探讨了分布式存储的原理与挑战,包括可扩展性、低成本、高性能和易用性的需求。介绍了数据分布式、一致性、容错及负载均衡等关键要素,以及哈希分布和一致性哈希在数据分布中的应用。还提到了分布式存储的协议,如Paxos协议,用于解决一致性问题和主节点选举。文章最后讨论了不同类型的分布式存储系统,如分布式文件系统、键值系统和数据库。
摘要由CSDN通过智能技术生成

我们继续互联网技术架构-分布式存储。

总目录

  • 分布式存储概述

  • 分布式存储特性 - 哈希分布/一致性哈希分布

  • 分布式存储协议 - 两阶段与Paxos

1. 概述

分布式存储作为互联网之核心基石,没有分布式海量存储就好比无源之水。分布式系统不是什么新鲜事物,教科书里已经研究了好多年,但是不温不火,直到近年互联网大数据应用的兴起才使得它大规模的应用到工程实践中,其主要特点概括为:规模大+成本低。现在的大型互联网公司少则几百几千个PC服务器,多的达到数百万级别低成本PC服务器集群;

总体来说,分布式存储需要具备以下一些要素:

  • 可扩展:灵活水平扩展到成百上千上万,并且整体性能线性增长

  • 低成本:构建与低成本PC,兼备自动容错,自动负载均衡等机制。

  • 高性能:秒,毫秒,亚秒级别。

  • 易用:构建生态环境,与其它系统集成,如监控,运维,数据导入。

分布式存储的挑战来源自于其设计的两个技术领域:分布式 + 存储:

  • 数据分布式:数据如何分布,数据如何跨服务器读写?

  • 一致性:数据如何replication,多个副本之间又如何同步

  • 容错:检测,并迁移故障服务器上的数据

  • 负载均衡:如何“空中加油”,运行中添加,卸载服务器

  • 事务并发:分布式事务,并发控制

分布式存储数据分类:

按照其所处理的数据类型来分的话,大体分为

  • 4
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值