通过与用户的不断沟通与交流,我们深挖如何通过技术和产品能力提升用户在生产环境中的排障效率和操作便捷性。在本次更新中,Kindling-OriginX 新增自动分类识别故障初因与自定义根因报告关联指标功能,详见功能说明:
慢故障列表支持展示故障初因,提前对故障进行分类,排查效率加倍
目前使用中,当故障列表中存在大量慢故障时,用户需要分别打开多个故障报告进行查阅,需要花费大量时间来对故障进行初步的识别和归类。
为了解决这一问题,本次更新中 Kindling-OriginX 新增自动分类并识别故障初因功能,并将故障初因在列表页进行归类展示。在故障排查过程中,用户只需要要快速浏览故障列表就可了解当前系统中故障的性质和可能的原因,从而加快排查的效率。
根因推导页支持配置自定义Grafana Dashboards,允许在推导过程中查看自定义指标
在当前版本中,用户查看故障根因推导报告过程中,面板中各类指标固定为经验指标。为了能够提供更加个性化的使用体验,让不同经验的用户都能够按照自己的使用习惯进行排查工作,本次更新引入了在根因推导页配置自定义 Grafana Dashboards 的功能。
用户可以根据自己的使用偏好和关注点,在 Kindling-OriginX 的故障报告中定制和展示与故障排查相关的指标。在提供内核行为可观测性核心能力的基础上,以配置化、轻量化的方式帮助用户串联各类可观测性数据,帮助用户聚焦故障问题的同时,最大化挖掘可观测性数据的价值。
更多新特性请查看下述更新列表。
新增功能
-
慢故障列表支持展示“故障初因”,提前对故障进行分类
-
根因推导页支持配置自定义Grafana Dashboards,允许在推导过程中查看自定义指标
-
日志页面和Exception页面支持“查找”和“导出”功能
探针支持采集应用输出到日志文件中的日志
功能优化
-
优化错误故障中异常信息的展示形式
-
故障根因结论中展示推导过程中已检查的指标项
缺陷修复
-
修复配置SLO目标时,历史的请求成功率单位错误的问题
-
修复配置服务别名后,SLO状态中服务别名没有实时生效的问题