导读:为了让大家更好的 APM 系统的设计实现,我将在公众号编写《云原生之可观测性》系列文章,深入讲解 APM 系统的产品设计、架构设计和基础技术。APM是一个庞杂的技术体系,涉及到很多开源技术,欢迎大家留言讨论。
本文主要从以下几个维度来阐述APM:
1、APM是什么?
2、APM的目的是什么?
3、APM开源框架
一. APM是什么?
APM 是Application Performance Managment的缩写,即:“应用性能管理”。现代的APM体系,基本都是参考Google的《Dapper,大规模分布式系统的跟踪系统》(公众号回复: APM,领取高清版本文档)的体系来实践的。
APM属于IT运维管理(AIOps)范畴。主要是针对企业关键业务的IT应用性能和用户体验的监测、优化,提高企业IT应用的可靠性和质量,保证用户得到良好的服务,降低IT总体拥有成本(Total cost of ownership - TCO)。
后来由Gartner归纳抽象出来一套概念框架,如下图:
![cd4a0deb479d32686dba3f2e5b12acaf.png](https://img-blog.csdnimg.cn/img_convert/cd4a0deb479d32686dba3f2e5b12acaf.png)
Gartner的APM Conceptual Framework(概念框架)是经过大量调研与分析后的归纳与抽象,这些切实需求由来已久,IT从业者们对它的理解与实践也几乎是从IT诞生至今就已开始,这并不是一次发明。
1、终端用户体验:End User Experience
2、运行时应用架构:Runtime application architecture
3、业务事务分析:Business Transactions
4、深度组件监控:Deep Dive Component Monitoring
5、分析报告:Analytics / Reporting
关于APM概念框架,之后将结合案例讲解。
二、APM的目的是什么?
随着中台、微服务、云原生架构的流行,应用系统本身正变得越来越难以管理,终端用户的一次请求往往需要涉及到多个服务,因此服务性能监控和问题排查就变得异常的复杂。不同的服务可能由不同国家,不同团队,和不同编程语言来实现。服务可能部署在成千上万台服务器,跨越不同机房,不同数据中心。
![ccc8c688d0cbf9387273afbd37bcb47b.png](https://img-blog.csdnimg.cn/img_convert/ccc8c688d0cbf9387273afbd37bcb47b.png)
如上图,一次请求经过多个应用,实际情况可能比上图还要复杂,那么我们如何去发现问题和排查问题,以及它们的性能如何?如果性能不好,我们该如何去优化呢?是去优化应用C还是去优化应用D呢?
因此,就需要一个可以帮助理解系统行为、用于分析性能问题的工具,以便发生故障的时候,能够快速定位和解决问题,这就是APM系统。
APM最早是谷歌公开的论文提到的 Google Dapper。Dapper是Google生产环境下的分布式跟踪系统,自从Dapper发展成为一流的监控系统之后,给google的开发者和运维团队帮了大忙,所以谷歌公开论文分享了Dapper。
三、APM开源套件
APM是一种理念,一种方法论,主要指对企业关键业务应用进行观测、分析、优化。从而提高企业应用的可靠性和稳定性。
从用户的角度来说:可以保证为用户提供高质量的服务。
从企业的角度来说:可以为企业降低IT的总成本。