www.fireknight.tech 个人博客,欢迎访问,CSDN不定期更新
-
总结
- 使用机器学习,基于日志记录,进行错误预测和故障定位
- 机器学习:分类算法。日志扔进去,分类为正确或错误,属于什么错误
- 训练集:多种错误分别注入,日志收集,对应有故障标签,训练
- 缺陷:首先要有针对某个服务的训练集,其次错误类型相比实际应该很小,跑的时候不一定分的出来
-
Intro
-
提出了基于执行轨迹日志机器学习的微服务潜在错误与故障根源预测方法
-
故障类型:
- 多实例故障、系统配置故障、异步交互故障
-
MEPFL
-
预测目标
- 轨迹层级:潜在错误(T/F)、故障微服务、故障类型,微服务层级:微服务的故障类型(使用一组微服务运行时特征预测)
-
过程:
- 离线训练+在线预测
-
-
预测模型:
-
特征定义
-
轨迹层级
- [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9Gr3fg4j-1648632316767)(assets/image-20220330170328-d2xsxh1.png)]
-
微服务系统层级:
- 每个服务的RSC、轨迹执行时间、轨迹涉及微服务数、轨迹实例中涉及微服务实例数
-
-
模型设计
- 四个分类模型
- 训练方法:随机森林、K邻近、多层感知机
-
训练集(故障注入)
- 多种错误分别注入,日志收集,对应有故障标签,训练
-