基于WEB的分布式文件系统设计关键点
/**
* @基于WEB的分布式文件系统
* @Apache服务器 【图一】
* @核心是对如何处理进入的请求做出几条假设
* 组织结构的基本原理是挂钩的概念——一组特定的函数的占位符
* apache核心假设请求在许多阶段中处理,其中每个阶段都有几个挂钩组成
* 每个挂钩代表需要作为处理请求的一部分而执行一组类似的动作
* @apache执行了关于请求的控制流——想一想过滤器和拦截器的?
* 与一个挂钩关联的函数全都是单独的模块组成的,提供模块,然后组合模块
* @web 服务器集群 [图二]
* @web 代理缓存 【图三】
* @web 宿主系统的复制 【图4】
* @内容分发网络CDN content delivery network
* 担当web宿主服务,提供一种基础结构来分布和复制整个Interrnet上的多个站点的web文档
* 完整的CDN要求自动分布和复制宿主的文档,从而导致自管理系统的体系结构
* 大规模的CDN是沿着反馈控制环的线路组织的
* @指标评估
* 当涉及宿主复制的内容时,需要许多方面之间进行这种————平衡力
* @延迟指标
* @度量执行一个动作的时间形成分析的指标
* @度量两个节点之间的网络带宽是更加重要的指标
* 很多工具可以度量。使用Ml工具概率
* @空间指标
* 依据网络级路由跳段数或者自主系统之间的跳段来度量节点之间的距离
*
* @网络使用指标
* 计算传输的字节需要的带宽计算
*
* @一致性指标
* 度量一个副本在多大程度上偏离了主副本
*
* @财务指标
* 使用CDN的money
*
* @修正触发
* 定期检查发生的变化,采取计划变更方法————太绝对的手段了
* @大规模突发访问处理方法预测期 flash-crowd predictor
* @给服务器提供足够的时间来动态安装WEB文档的副本。
* @然后当进入的请求过度时,就开始重定向访问。
* @简单的线性外推技术
* 在特定的时间间隔[t-W,t]内持续不断的测量请求数并记录,W窗口大小
* 转换为时间函数外推时间内的预测阈值
*
* @采取合适的措施
* 改变副本的布置
* 改变一致性执行策略
* 决定如何以及何时重定向客户请求
* 自适应重构重定向策略
* TCP移交
* Dns重定向
* 透明机制客户对于文档所在的位置一无所知
*
* HTTp重定向
*
* TODO: 2022/10/13
* https://pan.baidu.com/s/1zOv4HvkR1ph752LtoCy8Dw?pwd=rfg3
*/
关于指标的理解重要的决策元素
来源《分布式系统原理和范型》