关键:FastDFS分布式文件存储、页面静态化、celery、Nginx提供页面、数据缓存设置和获取、缓存数据(历史浏览)、页码控制
仅作为个人笔记!
目录
1.FastDFS文件存储
若图片等文件都保存在Django的服务器中,但是服务器的硬盘的容量是有限的,而且服务器的容量昂贵。容量和成本都会受到限制。需要保存大量的文件时,通常会有一个专门的文件存储的服务器。
1.1.什么是FastDFS?
简介
FastDFS 是用 c 语言编写的一款开源的分布式文件系统。FastDFS 为互联网量身定制, 充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用 FastDFS 很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。
FastDFS 架构包括 Tracker server 和 Storage server。客户端请求 Tracker server 进行文 件上传、下载,通过 Tracker server 调度最终由 Storage server 完成文件上传和下载。
Tracker server 作用是负载均衡和调度,通过 Tracker server 在文件上传时可以根据一些 策略找到 Storage server 提供文件上传服务。可以将 tracker 称为追踪服务器或调度服务器。
Storage server 作用是文件存储,客户端上传的文件最终存储在 Storage 服务器上, Storageserver 没有实现自己的文件系统而是利用操作系统 的文件系统来管理文件。可以将 storage 称为存储服务器。Storage有不同的组,组中的机器可以进行相互的备份,不同的组之间可以保存不同的数据。可以通过扩展组来方便的扩展容量。
Storage保存文件时,保存的不是简单的文件名,而是对文件的内容取哈希值(唯一的值,就像文件的指纹),再结合其他信息生成文件名。这样,不同的用户上传相同的文件(文件名可能不同,但哈希值是一样的)时,相同的文件在Storage中只需存储一份(文件去重还需要配置:https://blog.csdn.net/qq_26545305/article/details/80071256)。
优点:文件的海量存储、存储容量方便扩展、文件内容防止重复。
Tracker:管理集群,tracker 也可以实现集群。每个 tracker 节点地位平等。收集 Storage 集群的状态。
Storage:实际保存文件 Storage 分为多个组,每个组之间保存的文件是不同的。每 个组内部可以有多个成员,组成员内部保存的内容是一样的,组成员的地位是一致的,没有主从的概念。
保存文件ID的相关名词
- 组名:文件上传后所在的 storage 组名称,在文件上传成功后有 storage 服务器返回, 需要客户端自行保存。
- 虚拟磁盘路径:storage 配置的虚拟路径,与磁盘选项 store_path*对应。如果配置了 store_path0 则是 M00,如果配置了 store_path1 则是 M01,以此类推。
- 数据两级目录:storage 服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据 文件。
- 文件名:与文件上传时不同。是由存储服务器根据特定信息生成,文件名包含:源存储 服务器 IP 地址、文件创建时间戳、文件大小、随机数和文件拓展名等信息。
上传流程
Storage会定时向tracker 发送心跳连接。
client上传文件,请求tracker,tracker调度一个Storage的组,返回Storage的ip和端口给client;
client根据返回来请求Storage,上传文件;
Storage保存文件,生成文件file_id,并返回;
客户端接收到file_id并保存。
客户端上传文件后存储服务器将文件 ID 返回给客户端,此文件 ID 用于以后访问该文件的索引信息。文件索引信息包括:组名,虚拟磁盘路径,数据两级目录,文件名。类似: