FastDFS系统简介
FastDFS是一套分布式系统,提供上传照片与下载的服务,淘宝网之前的照片存储管理系统。
它是由存储器和追踪器组成的,其中,储存器和追踪器都可以称为服务集群,存储器负责存储照片,追踪器负责记录这些照片的地址,但是这样的系统与我们平时存储文件的方式却不太一样,比如我的电脑照片的存储地址
/Users/zy/Desktop/wzry.jpg
此时,我会把浏览器当作查询图片的查询器,输出/Users/zy/Desktop/wzry.jpg,会出现这张照片,但是如果在本机中改变了照片的存储位置时,我们的查询地址也要相应进行修改,这样修改的就是两个地方了1)文件存储位置 2)URL地址
而FastDFS解决了这样的问题,也就是说,用户在客户端只负责上传,存储器负责存储上传好的图片,追踪器负责记录这个图片的存储地址,那么追踪器是如何记录存储的地址呢?是不是和普通电脑上一样?
显然不是,追踪器会用hash算法将图片的内容进行计算,生成一串唯一的标识,不会与其他的图片重复,类似于我们的身份证,所以追踪器所储存的,并不是文件的目录,而是这个文件的标识符,如果要在客户端显示这张图片,我们输入这样的唯一标识id,接下来追踪器查询是否存储了这样的id,如果存储了就要去存储器中进内容获取,之后由服务器把请求的内容返回。
不能否认的是,生成的唯一标示会带有存储集群的范围查询地址,帮助缩小查询的范围,缩短查询时间,例如这样的:
id:group1/M00/00/00/wKjzh0_xaR63RExnAAAaDqbNk5E1398
group1/M00/00/00/:为图片在存储器中存储的地址;
wKjzh0_xaR63RExnAAAaDqbNk5E1398:为hash算法生成的唯一文件id标示
问题1:用户上传的照片与文件的名字有关系吗?
没有关系,最后的文件id仅仅与文件的内容有关,hash算法将内容进行计算
问题2:用户上传了重复的照片时,会怎样呢?
会提示用户上传成功,但是并不会在储存器中真的上传,而是返回给用户之前存储好的图片的唯一id,也就是说,hash算法通过计算发现两张图片的唯一id相同,此时返回给用户之前上传的图片标识。
问题3:理解了这种文件的存储方式之后,我的百度云盘里的500G还保熟吗?
很遗憾,显然不保熟了,因为相同的文件只在百度云的服务器保存一次,有谁执行这个文件的下载时,就返回给这个用户一个下载链接,只要你拥有这个文件的地址去请求追踪器,追踪器去进行比较查询服务器上是否存储这个链接,匹配成功请求存储器返回数据,此时那么你就可以执行下载命令,所以500G并不是500G,只是一个噱头,同时,不同用户之间如下载相同文件时,本质上的下载链接指向同一个文件。