摘要:
随着互联网业务的迅猛发展,互联网相关企业的服务器承受着越来越多的压力,并且随时有扩容的需求.为确保服务器稳定的运行,对服务器的性能进行监控,对企业来说有着十分重要的实际意义.当下的服务器性能监控技术虽能提供实时的性能数据,并在性能瓶颈时产生报警,但缺乏历史数据的存储与查询以及性能数据分析等方面的功能.本论文在借鉴现有监控技术的基础上,设计并实现了一整套Linux服务器性能监控与分析系统(Server Performance Monitor,文中简称SPM). 本文首先对一系列传统的服务器性能监控技术以及数据分析方法进行了概述,然后详细介绍了本系统中性能数据采集与传输模块的设计与实现,包括对不同的远程数据传输方法进行了性能比较以及模块程序的版本自动更新;针对产生的海量性能数据,本文在Hadoop数据处理框架上建立了一套性能数据存储与查询系统,系统通过HDFS (Hadoop Distribute File System)对性能数据进行二进制存储,同时利用MapReduce框架编写后台程序,实现了性能数据的并发式查询.之后,利用系统查询获得的历史性能数据,论文对异常性能数据进行了分析,通过观察各类性能数据的变化曲线定义出突发式异常,分布式异常以及内存泄露式异常,根据异常特征提出了动态阈值法,函数模型法等检测手段,并对异常出现的原因进行了简要分析.本文最后对服务器性能监控技术的研究成果进行了总结和展望.
展开