根因定位
文章平均质量分 95
Doooo19
争取做一个日更的小仙女呀,转zhihu啦
展开
-
【图神经网络工具】PyTorch Geometric基础知识(一)
工业界的微服务系统通常是由几十到几千个服务运行在不同的机器上组成的大规模分布式系统。系统的异常往往可以体现在trace和log中,分别记录服务间的交互和服务内的行为。现有的跟踪异常检测方法将跟踪视为一系列服务调用。他们忽略了由其调用层次结构和并行/异步调用带来的跟踪的复杂结构。另一方面,现有的日志异常检测方法将日志视为一系列事件,无法处理分布在大量交互复杂的服务中的微服务日志。在本文中,我们提出了 DeepTraLog,一种基于深度学习的微服务异常检测方法。原创 2023-09-26 13:13:37 · 776 阅读 · 0 评论 -
论文阅读【异常检测】Deep One-Class Classification(附代码)
尽管深度学习在许多机器学习问题上取得了巨大进步,但用于异常检测的深度学习方法相对缺乏。那些确实存在的方法涉及经过训练以执行异常检测之外的任务的网络,即生成模型或压缩,这些网络又适用于异常检测;他们没有接受过基于异常检测目标的培训。在本文中,我们介绍了一种新的异常检测方法——深度支持向量数据描述——该方法是在基于异常检测的目标上进行训练的。对深层机制的适应需要我们的神经网络和训练程序满足某些属性,我们在理论上证明了这一点。我们展示了我们的方法在 MNIST 和 CIFAR-10 图像基准数据集以及 GT SR原创 2023-09-05 16:12:30 · 614 阅读 · 0 评论 -
【根因定位】报警聚类算法在美团业务系统的落地实施
在业务服务中,日志记录了关键执行点、程序执行错误时的现场信息等重要信息。当系统出现故障时,运维人员通常会查看错误日志来定位故障原因。在业务流量较小、逻辑复杂度较低的情况下,错误日志较少,运维人员可以快速定位问题。然而,随着业务逻辑的不断迭代和系统接入的依赖服务增多,错误日志的数量可能急剧增加。在这种情况下,错误日志的内容可能相互掩埋、相互影响,运维人员面对大量报错可能难以理清逻辑,导致难以快速解决核心问题。报警信息是系统中的一种重要报告机制,用于通知运维人员发生故障或异常。原创 2023-07-27 15:52:24 · 464 阅读 · 0 评论