华为立体运维-第五课(APM介绍)

一APM简介
云应用性能管理服务(Application Performance Management,简称APM)是实时监控并管理云应用性能和故障的云服务,提供专业的分布式应用性能分析能力,
可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。
APM作为云应用诊断服务,适用于多种JAVA框架的应用。包含了强大的分析工具,通过拓扑图,调用链,事务将应用状态,调用过程,用户对应用进行的操作可视化地展现了出来,以便快速定位
哪些过程出现了问题或者哪里是需要进行改善地性能瓶颈

二功能简介
2.1拓扑
    APM通过拓扑可视化展示应用间调用关系和依赖关系。拓扑使用应用性能指数(Apdex)对应用性能满意度进行量化,并使用不同颜色对不同区间Apdex的值进行标识,方便快速发现性能问题,并进行定位。

2.2事务
    APM通过对事务(从WEB客户端或移动终端到服务端全栈业务流)实时分析,使用Apdex对应用打分,直观体现用户对应用的满意度。
调用链追踪:APM能够针对应用的调用情况,对调用次数,相应时间和出错率次数进行全方面的监控,可视化展现业务轨迹和状态,协助性能及故障快速定界。
2.3非侵入式采集
    APM是通过在应用所在节点上安装采集代理(ICAgent)来完成应用性能数据采集的。采集代理是基于业界Pinpoint开源项目,通过非侵入方式采集应用性能指标的。您不需要修改您的业务代码,就可以轻松接入APM,完成APM对您应用的性能管理。采集代理只采集业务调用数据、服务存量数据、调用的KPI数据,不会收集您的隐私数据。
2.4端侧分析
    云应用性能管理-Mobile致力于提供清晰直观的移动APP性能监控数据,通过用户体验,吞吐量,Crash,ANR(Application Not Response)等多项指标,为您展现不同纬度的移动APP性能数据,快速定位性能瓶颈,完成移动APP性能优化。
2.5异常SQL分析
    APM提供数据库,SQL语句的调用次数,响应时间,错误次数等关键指标视图,通过这些指标视图,可以分析异常(慢或调用)出错,SQL语句导致的数据库性能问题
2.6方法追踪
    方法追踪是采集探针的一个扩展功能,通过对某个类的某个方法进行动态埋点,实现对某个类的某个方法追踪。当这个类的方法被调用时,探针将对配置的方法进行性能数据采集,并将采集数据展现在方法追踪界面中。
方法追踪主要哟哦你过来帮助应用的开发人员在线定位方法级性能问题

三拓扑
拓扑是对应用间调用关系和依赖关系的可视化展示(拓扑图)。拓扑图主要是由圆圈、箭头连线、资源组成。每个圆圈代表一个应用,圆圈上每个分区代表一个实例。每个圆圈中的分数表示活跃的实例/总实例数。分数下的内容分别表示在当前所选的时间中应用的服务时延、应用被调用次数、错误数。每个箭头连线代表一个调用关系。调用次数越多,连线越粗。连线上的数据表示吞吐量和整体时延。吞吐量即所选时间的调用次数。拓扑使用Apdex对用户应用性能满意度进行量化,并使用不同颜色对不同区间Apdex的值进行标识,方便用户快速发现问题,并进行定位。
APM提供按照服务,服务类型,调用次数,错误数,Apdex,资源ID多个维度的搜索方式。搜索条件支持“=”,“不等于”,“包含”三种搜索条件。

四拓扑实例说明

五全链路拓扑

六拓扑-搜索

APM提供按照服务,服务类型,调用次数,错误数,Apdex,资源ID多个维度的搜索方式。搜索条件支持“=”,“不等于”,“包含”三种搜索条件。

七拓扑-操作
在拓扑页面右键单机,可以看到更多功能

​​八事务
该事务指的是http事务。

用户在华为商城购买一台手机,用户的电脑会向华为商城服务后端发起一次http请求,该过程发生的http请求就是一个http事务,
由于http请求的url地址有唯一性,我们把url地址作为事务的名称,当部署探针(pinpoint)的服务(java类型应用)接收到一条http事务后,
APM系统就会将该事务的信息抓取并呈现在APM管理面。

 


九事务总览
在APM界面,点击左侧手风琴中的”事务列表”菜单,就会看到最新的事务列表信息,下图中红色选定的部分就是刚刚提到的用户购买手机的事务。APM提供了数据源,调用次数,整体时延,错误数,Apdex共计5个维度的分析数据。

十事务—名词解释
1、数据源。数据源表示事务的发起方,比如用户在华为商城购买东西,有可能是通过手机App购买,有可能是登录商城网站(browser)购买。如果通过App购买,在事务统计中APM通过符号           表示;如果通过商城网站购买,则通过          表示。           表示所有的数据来源(包括App和browser)。
2、调用次数。调用次数表示单位时间内事务发生的次数,比如最近一分钟内,发生了1000次购买手机的操作,则购买手机的事务调用次数为1000
3、整体时延。时延指调用从发起请求到获得响应的耗时。APM中,整体时延指整个请求的总耗时。
在该条事务中,服务A向服务B发起一个请求,B接收到请求后又向C发起一次请求,等待C请求返回后,B再返回给A。整体时延指的就是整个请求的耗时,就是图中的TA。
4、错误数。由于网络原因或其他原因导致用户请求失败,该请求事务被称为错误事务。错误数表示错误事务的个数。
5、Apdex。Apdex全称是Application Performance Index,是由Apdex联盟开发的用于评估应用性能的工业标准。Apdex标准从用户的角度出发,将对应用响应时间的表现,转为用户对于应用性能的可量化范围为0-1的满意度评价。

十一数据源

比如华为商城总共发生150次购买手机操作,通过网站登录购买手机的操作发生100次,通过手机终端(App)的操作发生50次。则手机购买事务共被调用150次。其中来自browser侧100次,来自手机终端(App)侧共50次。
购买手机时,由于网络异常或者服务器出错导致部分客户购买失败,该条事务则被统计为错误事务。错误数表示错误事务的总条数。

十二事务功能简介

十三事务-事务拓扑

选择一条事务 ,点击“查看事务拓扑图”,就会看到这条事务详细的拓扑图,如上图展示的即是GET _/product/searchAll该条事务的拓扑图,从上图可以看到如下信息。

①、在11:25~11:26这一分钟内,该事物共计被调用4次,整体平均时延为12ms。
②、该事务被调用时,共经过3个服务,2个数据库(redis和mysql)。
③、这一分钟内,事务发生时,redis数据库被调用16次,mysql被调用4次。
④、图中的服务包括请求都是正常状态(绿色)。
十四事务-时延分析

十五 调用链
随着互联网架构的扩张,分布式系统变得日趋复杂,越来越多的组件开始走向分布式化,如微服务、消息收发、分布式数据库、分布式缓存、分布式对象存储、跨域调用,这些组件共同构成了繁杂的分布式网络,
那现在的问题是一个请求经过了这些服务后其中出现了一个调用失败的问题,只知道有异常,但具体的异常在哪个服务引起的就需要进入每一个服务里面看日志,这样的处理效率是非常低的。
分布式调用链其实就是将一次分布式请求还原成调用链路。显式的在后端查看一次分布式请求的调用情况,比如各个节点上的耗时、请求具体打到了哪台机器上、每个服务节点的请求状态等等。

全链路性能监控从整体维度到局部维度展示各项指标,将跨应用的所有调用链性能信息集中展现,可方便度量整体和局部性能,并且方便找到故障产生的源头,生产上可极大缩短故障排除时间。

十六调用链总览

十七调用链详细

十八SQL分析
APM提供图表形式展现数据库、SQL语句的调用次数、响应时间、错误次数等关键指标,用于分析异常SQL语句导致的数据库性能问题。这里的异常SQL语句指慢SQL语句和调用出错的SQL语句。
APM支持Cassandra、Memcached、MongoDB、MySQL、Oracle、PostgreSQL、Redis多种主流数据库。这里的数据库指使用SQL的关系型数据库MySQL、Oracle、PostgreSQL,不包括非关系型数据库Cassandra、Memcached、MongoDB、Redis。
十九SQL分析-概览

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值