facebook 照片存储系统haystack的学习

最新推荐文章于 2021-10-14 20:15:35 发布

binling

最新推荐文章于 2021-10-14 20:15:35 发布

阅读量1.9k

点赞数

分类专栏：架构数据存储和查找系统分析设计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/binling/article/details/50856413

版权

系统分析设计同时被 3 个专栏收录

50 篇文章

订阅专栏

35 篇文章

订阅专栏

数据存储和查找

5 篇文章

订阅专栏

本文探讨了通过限制目录中文件数量、整合相似文件及优化元数据存储方式，以减少磁盘操作次数，提高文件读取效率的方法。以Haystack系统为例，展示了如何实现读取照片只需一次磁盘操作的技术细节。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

之前的solution是POSIX based filesystem：一些NAS(Network attached storage) 设备mount 到NFS上

主要问题：per file metadata 导致过多的disk operation because of metadata lookup。

读取一个文件一般至少3个步骤

1）一次或者多次disk operation 访问到directory 的metadata, 从文件名得到文件的的inode

2) 把文件的inode从磁盘读入，得到文件的metadata/file handle(物理地址信息，size等）

3）读文件本身

实际情况：读一个文件可能涉及10次disk operation

一个简单的优化：不要让一个目录装太多文件，100来个比较好，这样一页可以装下目录的metadata，使得访问目录metadata只需要一次IO，这样访问一个文件只需要3次IO

Haystack的主要设计目标就是使得读一个照片只需要一次disk operation，就是读文件本身的IO，所有metadata都在memory里。

要把所有metadata都放到memory里，需要reduce整体metadata的大小，方法就改变per file metadata的结构，多个照片文件放到一个大文件里，维护一个in-memory的 mapping： photo id -> {file, offset, size}，这样物理file的个数（同时inode的数目）大大减少了。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。