Colossus under the hood: a peek into Google’s scalable storage system——文章泛读

Web page 分布式元数据论文阅读笔记整理

本文工作

介绍为谷歌云提供支持的基础存储系统Colossus。

所有 Google 都由一组通用的可扩展服务组成,每个存储服务都使用三个主要构建块:

  • Colossus 是集群级文件系统,是 Google 文件系统 (GFS) 的后继者。

  • Spanner 是全球一致、可扩展的关系数据库。

  • Borg 是一个可扩展的作业调度程序,可以启动从计算到存储服务的所有内容。

Borg 提供所需的资源,Spanner 存储有关访问权限和数据位置的所有元数据,Colossus 管理、存储并提供对所有数据的访问。

Colossus 介绍

  • Client library:客户端库是应用程序或服务与 Colossus 交互的方式。根据应用程序的要求,客户端可以使用许多功能,例如软件 RAID。基于 Colossus 构建的应用程序使用各种编码来针对不同的工作负载微调性能和成本权衡。

  • Colossus Control Plane:Colossus 的基础是其可扩展的元数据服务,该服务由许多 Curator 组成。客户直接与 Curator 对话以进行控制操作,例如文件创建。

  • Metadata database:Curator 将文件系统元数据存储在高性能 NoSQL 数据库 BigTable 中,为了解决在尝试容纳与搜索相关的元数据时遇到的 GFS 的扩展限制。将文件元数据存储在 BigTable 中,使 Colossus 的扩展能力比最大的 GFS 集群高出 100 倍以上。

  • D File Servers:Colossus 最大限度地减少了网络上数据的跳数。数据直接在客户端和 D 文件服务器(网络附加磁盘)之间流动。

  • Custodians:后台存储管理器,用于维护数据的持久性和可用性、整体效率、磁盘空间平衡、 RAID 重建等任务。

性能介绍

可扩展性

各种实例共享相同的底层文件系统来完成请求,由 Colossus 控制平面管理的共享存储池。通过资源分解提高宝贵资源的使用效率,并降低所有工作负载的成本。例如,可以满足低延迟工作负载(如 YouTube 视频)的峰值需求,通过填补空闲时间的空白来更便宜地运行批量分析工作负载。

简化硬件复杂性

Google 数据中心拥有种类繁多的底层存储硬件,提供多种大小和类型的磁盘和闪存存储组合。此外,应用程序在耐用性、可用性和延迟方面有着多样化的需求。为了确保每个应用程序拥有所需的存储,Colossus 提供了一系列服务级别。应用程序通过指定 I/O、可用性和持久性要求来使用这些不同的层,然后将资源(字节和 I/O)配置为抽象的、无差别的单元。

最大化存储效率

Colossus 利用数据具有多种访问模式和频率(即频繁访问的热数据),混合使用闪存和磁盘存储来满足任何需求,避免过度配置。最热的数据存储在闪存中,以实现更高效的服务和更低的延迟。通过闪存,将每 GB 的 I/O 密度提高到磁盘可以提供的水平,通过磁盘,以确保足够的容量。

对于基于磁盘的存储,希望保持磁盘满且繁忙,以避免浪费磁盘 IOP。Colossus 使用智能磁盘管理,新写入的数据(即较热的数据)均匀分布在集群中的所有驱动器上,随着数据老化和变冷,数据被重新平衡并移动到更大容量的驱动器。

总结

对 Google 存储服务的基本介绍, 其中包括三个主要组件:Colossus,集群级文件系统;Spanner,全球一致、可扩展的关系数据库;Borg,可扩展的作业调度程序。Colossus 包含5个部分:Client library,应用程序或服务与 Colossus 交互的方式,使用各种编码来针对不同的工作负载微调性能和成本权衡;Colossus Control Plane,可扩展的元数据服务,由许多 Curator 组成;Metadata database,将文件系统元数据存储在高性能 NoSQL 数据库 BigTable 中;D File Servers,减少了网络上数据的跳数,数据直接在客户端和 D 文件服务器(网络附加磁盘)之间流动;Custodians,后台存储管理器,维护数据的持久性和可用性、效率、磁盘空间平衡、 RAID 重建等任务。

  • 22
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

妙BOOK言

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值