读 LBFS 有感

最新推荐文章于 2021-06-12 22:58:19 发布

xiaoqiangXX

最新推荐文章于 2021-06-12 22:58:19 发布

阅读量6.6k

点赞数

分类专栏：读书摘抄思考文章标签：服务器存储系统存储算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaoqiangxx/article/details/6087702

版权

读书摘抄思考专栏收录该内容

9 篇文章 0 订阅

订阅专栏

读 LBFS 有感

LBFS解决在低带宽的前提下如何实现一个文件系统。其的大致思路如下，对文件进行分片，寻找出客户端与服务器端不同的片，只传输差异的文件片，在客户端和服务器端重新合成文件进行保存。

文件片的计算方法采用的是CDC算法，实验中采用8KB的chunk size和48B的滑动窗口。该算法需要仔细研究下。在LBFS的另一个作者的pastwatch项目中，有该算法源码，好好研究下。

无论在客户端还是服务器端，LBFS利用文件片实现的是在所有文件中查找是否相同片。这个就带来了一个问题，文件片所形成的HASH表将十分巨大。以1G的数据量为例，8KB的数据片大小，那么需要131072个HASH值，简化为10W。如果数据量增加到1TB那么需要10W*1000 = 10亿个HASH值。这里假设了1TB数据中所有的8KB数据块都不相同，需要10亿个HASH来标示数据块。这个假设具有一定的合理性，因为现在的存储系统支持几十个TB，甚至上百TB容量，在这样的存储容量下1TB的数据以8KB为单位不重复是很有可能。这时对于10亿个HASH值的高速检索和存储需要解决。

LBFS服务器在存储文件时，如上传一个新的文件，如果该文件与存储系统中的已有块，有相同块，那么将不传输相同块。但是LBFS将直接复制相同块到新文件中，从而形成一个新的文件。LBFS的该做法并不能减少服务器端存储所占用的空间。不过该做法有一个极大的好处，不用单独的存储文件片，文件片存在于需要保存的文件中，文件片的HASH值以及偏移量，长度等信息会指明该文件片。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

xiaoqiangXX CSDN认证博客专家 CSDN认证企业博客

码龄16年

59: 原创

105万+: 周排名

48万+: 总排名

15万+: 访问

: 等级

2503: 积分

19: 粉丝

15: 获赞

13: 评论

26: 收藏

私信

关注

热门文章

分类专栏

最新评论

乐观复制算法-1.介绍
kugounick: 获益匪浅
OverlayIcon 制作流程及注意项
heyneo: 我想问一下，怎么找到自己的工程GUID？
计算与存储的融合
mniwc: 请问，这篇文章有公开发表的期刊论文吗？
谈一下自己收集资料和整理资料的经验
水晶冰: 我觉得有以下几点，、整理客户资料需要清晰的分类　　有了分类，下次看到条目就能够立刻找到自己的所需。 2、制定跟进规则　　有条理的进行跟进，不流掉任何一个资源，不漏掉任何一个客户。 3、及时客观地记录跟进过程　　记录过程，实时进行总结，方便与接下来进一步的客户分析、报告。 4、定时更新客户状态，总结跟进进展　　整理客户消息，随时总结，提高跟进效率。 5、借助有效的客户资源整理工具利用高科技产品随时记录，减轻自己负担，提高办公效率。http://www.haobitou.com/#001非常重要
OverlayIcon 制作流程及注意项
txz_yshb: 我按照这个步骤确实实现了，但是有个问题，就是必须重启explorer吗？感觉对用户很不友好网上说的SHChangeNotify也没效

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。