海量小文件同步

最新推荐文章于 2021-09-25 09:43:10 发布

weixin_34404393

最新推荐文章于 2021-09-25 09:43:10 发布

阅读量64

点赞数

文章标签：运维

原文链接：http://blog.51cto.com/lucifer119/1734285

版权

集中式存储是目前中小企业广泛采用的方案，随着时间的流逝，这些存储不可避免的膨胀。集中式存储的弊端愈加显现，同步就是其中一个。

环境:

文件容量以TB计，里面是千万/亿级的小文件，分布在成千上万的子文件夹内。

分析：

rsync几乎是唯一选择，海量小文件同步面临的问题主要是rsync无止境的扫描，同步进度难以把控，巨大的临时目录等。所以解决办法只能是庖丁解牛，将一个大任务分解成N个小任务。

场景假设如下：

1、源服务器目录结构是按照年月日分布，示例如下

1	`/www/p_w_picpaths/` `2014` `/` `04` `/` `30` `/xxx.png`

2、目标rsync服务器为 192.168.1.2::www，且可写。

解决办法：

很明显，同步最底层的目录最快。

1

2

3

4

5

6

find /www/p_w_picpaths \

-mindepth 3 \

-maxdepth 3 \

- type d \

- exec rsync -aquR {}/ 192.168.1.2::www /p_w_picpaths/ \; \

- exec echo /www/p_w_picpaths/ {} done \;

注：-R 可解决远程rsync服务器的目录结构问题。

另一种方法是for循环，比较好理解。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

#!/usr/bin/env bash

dir = "www/p_w_picpaths"

for year in 2014 2015 ; do

for month in ` seq 1 12`; do

for day in ` seq 1 31`; do

if [ -d /$ dir /$year/$month/$day ]; then

rsync -aqu /$ dir /$year/$month/$day/ 192.168.1.2::$ dir /$year/$month/$day/

else

echo "directory /$dir/$year/$month/$day not exist."

fi

done

done

done

集中式存储的缺点是: 必须提前做容量规划，存储严格控制在设计容量内之内，如果要扩展，必须重新进行容量规划。

要根本解决这个问题，终极的办法似乎只有分布式文件系统，用全新的设计理念的来解决存储问题,按需扩展。

可惜的是，目前的分布式文件系统几乎都是为大文件而设计，对于海量小文件支持都不够。ceph足够优秀，但是还不完全成熟。

本文出自 “专注Linux 运维” 博客，请务必保留此出处http://purplegrape.blog.51cto.com/1330104/1404981

转载于:https://blog.51cto.com/lucifer119/1734285

weixin_34404393

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
海量小文件同步

集中式存储是目前中小企业广泛采用的方案，随着时间的流逝，这些存储不可避免的膨胀。集中式存储的弊端愈加显现，同步就是其中一个。环境:文件容量以TB计，里面是千万/亿级的小文件，分布在成千上万的子文件夹内。分析：rsync几乎是唯一选择，海量小文件同步面临的问题主要是rsync无止境的扫描，同步进度难以把控，巨大的临时目录等。所以解决办法只能是庖丁解牛，将一个大任务分解成N个小任...
复制链接

扫一扫

weixin_34404393 CSDN认证博客专家 CSDN认证企业博客

码龄8年

136: 原创

-: 周排名

194万+: 总排名

122万+: 访问

: 等级

7158: 积分

4147: 粉丝

224: 获赞

24: 评论

1054: 收藏

私信

关注

热门文章

最新评论

原码,补码
做而论道_CS: 计算机，有 8 位机、16 位机、...。每次运算，也就只用到 8、16 位二进制数。而且，计算机中，也只有加法器。那么，45－45 = 0，八位机将如下计算：　　0010 1101 + xxxx xxxx = 0000 0000。其中的：xxxx xxxx，就是【－45 的八位补码】。这个补码，到底是什么？你自己也能推导出来。先移项：xxxx xxxx = 0000 0000－0010 1101，可得出：xxxx xxxx = (借位 1) 1101 0011，取八位：xxxx xxxx = 1101 0011。至此，就求出了 [－45]补 = 1101 0011。求负数的补码，就是这么简单！
原码,补码
做而论道_CS: 其实，补码的原理，与 “取反加一” 毫无关系。补码的来源，可以用十进制来说明。假定，只使用两位数：0~99。此时，－1 就可以用 +99 代替。如：24－1 = 23 　　24 + 99 = (一百) 23 忽略进位，只取两位，这两种算法，功能相同。三角函数中，也有：－90° 与＋270° 等效。重点：　限定位数（或范围）后，数值变化就有了周期性。　正数（补码），就可以代表负数；　加法，就可以代替减法。因此：　学会了加法，就可走遍天下。
原码,补码
做而论道_CS: 码长八位时，各码的范围如下。原码：－127 ~ +127。反码：－127 ~ +127。补码：－128 ~ +127。注意：－128，没有原码反码，只有补码。没有原码，拿什么取反？没有反码，拿什么加一？
原码,补码
做而论道_CS: 码长八位时，各码的范围如下。原码：－127 ~ +127。反码：－127 ~ +127。补码：－128 ~ +127。注意：－128，没有原码反码，只有补码。没有原码，拿什么取反？没有反码，拿什么加一？其实，补码的原理，与 “取反加一” 毫无关系。补码的来源，可以用十进制来说明。假定，只使用两位数：0~99。此时，－1 就可以用 +99 代替。如：24－1 = 23 　　24 + 99 = (一百) 23 忽略进位，只取两位，这两种算法，功能相同。三角函数中，也有：－90° 与＋270° 等效。【限定位数（或范围）后，数值变化就有了周期性。】　正数（补码），就可以代表负数；　加法，就可以代替减法。　因此，学会了加法运算，就可走遍天下。计算机，有 8 位机、16 位机。每次运算，也就只用到 8、16 位二进制数。而且，计算机中，只有加法器。那么，45－45 = 0，八位机将如下计算：　　0010 1101 + xxxx xxxx = 0000 0000。其中的：xxxx xxxx，就是【－45 的八位补码】。这个补码，到底是什么？你自己也能推导出来。先移项：xxxx xxxx = 0000 0000－0010 1101，可得出：xxxx xxxx = (借位 1) 1101 0011，取八位：xxxx xxxx = 1101 0011。至此，就求出了 [－45]补 = 1101 0011。求负数的补码，就是这么简单！－－－－－－－－－－－－－－－－－实际上，任意负数（－X）的补码，都是：0 － X。你用二进制简单算一下，立刻就能得到结果。（－128 的 8 位补码，也就是这样求出来的。）同理，任意正数（＋X）的补码，也都是：0 ＋ X。 0 ＋ X，不就是 X 吗？即，正数的补码，就是 X 本身！－－－－－－－－－－－－－－－－－在现代计算机中，只有加法器，只能使用补码。所以，在计算机中，只有补码，并没有原码和反码。不存在的东西，学它干嘛呢？计算机老师，指望这个混饭吃呗。顺便，再抓几个不及格的，抖一下威风！真值机器数符号位原码反码取反加一符号位不变模同余 ... 专家写的这些，明显就是【拿个鞋拔子当做玉如意】。假货，不仅仅在古董行业才有啊！
WPF特效-实现弧形旋转轮播图
sadfasdfsadf: 兄弟有源码吗分享下

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。