具有分布式数据中心的在线社交网络的数据副本选择
根据新的社交网络模型(OSN),部署到全局数据中心,有助于减少服务延迟,但是增加了数据中心之间的通讯负载。依照Facebook为例,每个数据中心都具备所有数据的全部副本。由于构建的OSN模型中,会产生巨大的负载。这使得主控数据中心会更新其他的从数据中心。分布式数据存储的目的是缓和数据中心之间的通讯负载,由于存储的用户数据放置在距离用户最近的数据中心。然而当用户之间距离较远会产生频繁的数据交流,导致更长的服务延迟。在本文,提出减少数据中心之间通讯,取得较低的服务延迟。本文提出基于分布式数据中心数据副本机制(SD^3),因为副本需要数据中心之间数据更新,数据中心需要考虑更新率与访问率,目的是对于用户数据的复制。更进一步考虑,(SD3)吸收用户不同类型数据(状态更新,朋友邮箱,音乐等)等副本,确保副本能够减少数据中心的通讯。SD3融入3个策略去提高性能,分别为(locality-aware multicast update tree, replica deactivation, and congestion control).。在真实的环境Planelab实验台上进行的跟踪实验结果表明,与其他复制方法相比,SD3具有更高的效率和有效性。