大家在做网站开发的时候,都会遇到文件上传的问题,其中对上传文件的命名大家并没有通用标准,但随着上传文件越来越多的传到各种云存储的时候,上传文件名这时候是可以有一些可以优化的小细节的。
其中在阿里云的文档中清楚的写着。
OSS按照文件名UTF-8编码的顺序对用户数据进行自动分区,从而能够处理海量文件,以及承载高速率的客户请求。不过,如果您在上传大量文件时,在命名上使用了顺序前缀(如时间戳或字母顺序),可能会导致大量文件索引集中存储于某个特定分区。
当您的请求速率超过2000次/秒时(下载、上传、删除、拷贝、获取元数据信息等操作算1次操作,批量删除N个文件、列举N个文件等操作算N次操作),会带来如下后果:
- 该分区成为热点分区,导致分区的I/O能力被耗尽,或被系统自动限制请求速率。
- 热点分区的存在会触发系统进行持续的分区数据再均衡,这个过程可能会延长请求处理时间。
要解决这个问题,就要消除文件名中的顺序前缀。您可以在文件名前缀中引入某种随机性,这样文件索引(以及I/O负载)就会均匀分布在多个分区。
简单的说,就是你上传的文件会按着文件名分区存储,太多相似的命名文件会存在一个区,当大量IO操作的时候性能会下降。
解决的办法就是用随机文件名的方式让强制系统分区。
这里推荐一个简单有效的方法,就是把时间戳反转,由于反转的时间戳文件名中的前3位数字代表毫秒时间,会有1000种取值。而第4位数字,每1秒钟就会改变一次。同理第5位数字每10秒钟就会改变一次。以此类推,反转文件名后,极大地增强了前缀的随机性,从而将负载压力均匀地分摊在各个分区上,避免出现性能瓶颈,是个简单有效的优化存储办法。
最后送一段反转时间戳的小代码
return String((new Date().getTime())).split('').reverse().join('')
市面上大多数的云存储原理都类似,这样的优化方案也适用于七牛,又拍,腾讯等云提供商
=====================================================================
更新
上面提供的办法再遇到数组重命名时候因为事件间隔太短,时间不会更新,会出现返回字符串不变化的情况,在这个基础上增加一个随机数来保证唯一性。
return String((new Date().getTime())).split('').reverse().join('') + Math.random()