阿里云存储 OSS 最佳实践--上传文件命名

大家在做网站开发的时候,都会遇到文件上传的问题,其中对上传文件的命名大家并没有通用标准,但随着上传文件越来越多的传到各种云存储的时候,上传文件名这时候是可以有一些可以优化的小细节的。

其中在阿里云的文档中清楚的写着。

OSS按照文件名UTF-8编码的顺序对用户数据进行自动分区,从而能够处理海量文件,以及承载高速率的客户请求。不过,如果您在上传大量文件时,在命名上使用了顺序前缀(如时间戳或字母顺序),可能会导致大量文件索引集中存储于某个特定分区。

当您的请求速率超过2000次/秒时(下载、上传、删除、拷贝、获取元数据信息等操作算1次操作,批量删除N个文件、列举N个文件等操作算N次操作),会带来如下后果:

  • 该分区成为热点分区,导致分区的I/O能力被耗尽,或被系统自动限制请求速率。
  • 热点分区的存在会触发系统进行持续的分区数据再均衡,这个过程可能会延长请求处理时间。

要解决这个问题,就要消除文件名中的顺序前缀。您可以在文件名前缀中引入某种随机性,这样文件索引(以及I/O负载)就会均匀分布在多个分区。

 

简单的说,就是你上传的文件会按着文件名分区存储,太多相似的命名文件会存在一个区,当大量IO操作的时候性能会下降。

解决的办法就是用随机文件名的方式让强制系统分区。

这里推荐一个简单有效的方法,就是把时间戳反转,由于反转的时间戳文件名中的前3位数字代表毫秒时间,会有1000种取值。而第4位数字,每1秒钟就会改变一次。同理第5位数字每10秒钟就会改变一次。以此类推,反转文件名后,极大地增强了前缀的随机性,从而将负载压力均匀地分摊在各个分区上,避免出现性能瓶颈,是个简单有效的优化存储办法。

最后送一段反转时间戳的小代码

return String((new Date().getTime())).split('').reverse().join('')

市面上大多数的云存储原理都类似,这样的优化方案也适用于七牛,又拍,腾讯等云提供商

=====================================================================

更新

上面提供的办法再遇到数组重命名时候因为事件间隔太短,时间不会更新,会出现返回字符串不变化的情况,在这个基础上增加一个随机数来保证唯一性。

return String((new Date().getTime())).split('').reverse().join('') + Math.random()

 

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值