作者:张加浪,腾讯云云监控高级工程师
前言
某电商客户的网站加速 30% ,调用成功率上升3%,实现了分钟级定位故障…
某银行实现端到端的全链路覆盖和性能量化,解决了多处性能短板…
在云原生时代,且业务架构复杂、用户量庞大的场景下,他们怎么都能轻而易举地实现了?
方案背景
自研业务上云、业务服务云化,底层 IAAS、PAAS 等资源托管依赖,业务聚焦于业务逻辑实现。使用微服务框架开发服务进行敏捷开发,服务模块化运作。资源依赖托管、业务微服务化这些使得服务研发、运营变得更符合云化,但同时也使得对依赖资源的管理变复杂,由于整个业务链由许多部分组成,一套能实现监控完整覆盖且支持上云业务观测质量的监控方案显得尤为关键。
云的资源做了托管,对资源的诉求应该无需感知细节,但如何能及时有效了解性能质量情况,有问题能及时反馈给业务侧?这是大部分研发和运维的痛点,托管并不意味着不关注,反而是更高层级的要求。跳出相对单一的资源或场景,需要的是整个业务链的可观测性。
可观测性业界共识包括了 Metrics(指标)、Logging(日志)、Tracing(分布式链路追踪),三者有独立场景但也有相融合的点,可有效量化业务的整体性能和质量。
端到端的一体化监控解决方案目标是站在最终客户视角做监控覆盖,从终端(如PC、小程序、APP)操作发出请求,经过网络、应用服务器、后端服务逻辑,再实质的存储、中间件、资源服务器上获取数据,最后返回结果响应客户请求。
云拨测 CAT