升 级 不 止 步
欢迎来到 需求至上,功能完善 的
\ EasyOps 7.5版本 /
👇
>> 联动架构视图:深度融合监控与资源拓扑
传统上,依赖监控态势感知系统固有的分层拓扑结构虽有其优势,但在处理复杂系统尤其是核心数据关系时,往往显现出局限性。而架构视图的引入,很好的弥补了这项不足。
下图中我们可以看到,在监控态势感知界面的左侧栏,用户可无缝切换至架构视图模式。该视图基于CMDB的实例资源信息及关系,自动生成并展示详细的拓扑图。这一创新设计深度融合了监控信息与资源架构视图,使得用户在监控过程中能够直接利用已构建的架构拓扑图,实现监控数据的直观呈现与快速定位。
具体而言,当系统检测到某资源(如服务器)产生告警时,该资源在架构视图中的对应图标将自动变色(如变红),以醒目方式提示用户注意。同时,通过悬停或点击操作,用户可快速访问该资源的黄金指标数据及详细的监控详情,极大地提升了问题排查与响应的效率。
本次联动架构视图能力,研发团队花费小半年的时间反复打磨,未来我们还将计划将架构视图的能力进一步拓展至更多应用场景,如基于架构视图的自动化巡检、变更管理等,以全面提升系统的运维管理水平。同时,CMDB资源的动态变化与信息更新也将通过架构视图实时反映,为用户提供更加全面、准确的资源状态视图。所以请大家狠狠期待一下吧!
在本次升级中,告警屏蔽功能得到了显著增强,旨在提供更加灵活与细致的告警管理策略。
>> 告警屏蔽类型深化
原来我们主要聚焦于屏蔽告警通知,即当告警触发时,通过预设规则阻止符合条件的通知发送,而事件本身仍保留在系统中。然而,为了满足客户在特定维护期内完全避免接收任何相关事件的需求,我们引入了新的屏蔽类型——「不发送事件」。这一改进使得用户能够根据需要,选择 仅屏蔽通知 或 同时屏蔽事件与通知,提升了监控系统的灵活性和实用性。
>> 告警屏蔽期通知机制
为了进一步提升用户体验,我们增设了告警屏蔽期通知功能。当告警屏蔽期开始或结束时,系统将自动向相关运维负责人发送通知。这一设计旨在解决用户在屏蔽期间对系统状态变化缺乏直观感知的问题。通过这一机制,运维人员能够即时获知屏蔽状态的变化,从而有效规划工作流程,避免在屏蔽期间对无关告警进行不必要的处理。
同时,为了实现屏蔽策略的高效传达,我们新增支持站内信作为通知方式。当屏蔽策略生效时,系统会根据通知方式的设置即时发送通知,详细告知屏蔽原因、起止时间以及当前状态等信息。值得一提的是,新增的站内信作为平台内部的重要通知工具,具有即时性强、易于查看的特点,能够确保运维人员在工作过程中随时掌握系统状态变化。这一功能的引入填补了平台在内部通知方面的空白,进一步增强了平台的基础设施建设,也为平台其他功能的接入提供了有力支持。
综上所述,告警屏蔽配置在类型划分、通知机制及效果呈现等方面均实现了显著优化,为用户提供了更加灵活、高效、便捷的告警管理体验。
在AutoOps框架中,我们新增了流程库节点的功能--引入HTTP节点类型的支持,这一举措也是响应合作厂商的项目需求,怎么说呢,主打一个有求必应 [骄傲脸]。
通过集成HTTP节点,用户无需额外封装工具,即可直接基于平台发起HTTP请求,并根据外部服务的响应结果动态调整自动化流程的执行路径。这一特性尤为适用于需要等待特定外部系统(如ITSM流程)返回结果后再继续执行后续任务的场景。一旦接收到预期的响应(如ITSM流程成功完成的通知),自动化流程即可无缝衔接至下一阶段,确保整体流程的连贯性和高效性。
此外,HTTP节点还支持多种高级配置选项,包括但不限于发送通知、设置轮询规则以多次尝试执行特定操作,以及提供Webhook回调机制,以便与外部系统建立即时通信和事件响应体系。这些功能共同构建了一个强大的自动化流程生态,能够灵活应对各种复杂的业务场景和系统集成需求。
总得来说,HTTP节点的支持简化了与外部服务的交互流程,还通过丰富的配置选项和强大的扩展能力,为自动化流程的设计与实现带来了更多灵活性和便捷性。
在 CMDB 的资源自动发现方面,新增了全量的任务管理和执行历史能力。比如在CMDB资源纳管前期,需要做大量的采集工作时会遇到的问题:任务下发后无数据上报,不知从何处排查。
>> 新增全局任务管理功能
基于此,我们新增全局任务管理,实现了对资源自动发现任务的集中式监控与管理。用户可轻松通过任务管理界面访问各任务详情,该界面详尽记录了每项任务历次执行的具体情况,包括执行时间、状态等关键信息。若任务长时间未执行完毕或遭遇失败,用户可进一步点击任务详情,深入至执行细节层面,查看具体到主机级别的执行状态与基本信息。此外,在执行周期性任务时,系统还支持查看任务成功执行后上报的数据详情,确保数据的准确性与完整性。
>> 新增任务历史功能
为了增强用户问题诊断能力,我们还引入了扫描预览功能,允许用户直观查看资源发现结果,并可通过点击具体资源数字,快速跳转至实例详情页面,获取更深入的实例信息。
面对可能的异常采集情况,如设备故障导致的大量任务失败,该功能同样展现出强大的应对能力。通过任务历史记录,用户可以迅速定位问题时间段内的任务执行情况,并借助采集的配置信息、Agent版本、Sampler状态及版本合规性等相关数据,结合系统提供的错误信息提示,全面剖析异常原因,高效解决采集异常排查问题。
在使用平台采集功能(如 CMDB 自动发现、监控采集能力)时,背后会运行大量采集插件,但此前这些插件未在界面统一管理,仅对重要的 sampler 进行了管理,此次将插件管理能力补上。
-
自动纳管插件:插件纳管会自动扫描,针对线网中 agent 上的 easyops 相关插件自动获取扫描,无需客户手动维护。
-
插件查看视角:提供两个视角,一是 agent 视角,可查看 agent 上部署了哪些插件;二是插件视角,可查看特定插件部署在哪些 agent 上。可基于这两种视角进行插件管理动作。
-
插件管理:插件部署、卸载、重启、启动等管理动作已在 agent 管理中全面经验化封装
注:若要使用新插件管理能力,需将 Agent 升级至 3.53 版本以上。
在监控视角下,运维人员希望工作台可以帮助他们可快速开展日常工作,如负责的监控资源状态是否异常、有无告警需及时处理、告警等级分布如何、是否存在潜在故障及常见监控功能如何潜在跳转等。
为此,我们打造了一个监控类工作台,它作为通用工作台的延伸,集成了多种监控类卡片,支持用户根据实际需求进行灵活配置。
1. “我的监控资源”卡片:
可自定义关注资源,不同运维人员(如主机运维、数据库运维、应用运维等)关注资源不同,可订阅各自所需资源,并根据当前负责人统计对应资源数量进行过滤,也可点击跳转至自定义的相应资源列表。
2.“未恢复告警事件”卡片:
根据当前用户展示需处理的未恢复告警事件,配置该卡片后,按责任人过滤展示,事件可进行响应、转单等快捷操作。
3.“告警等级分布”卡片:
可查看告警等级分布情况,若全是严重告警需及时解决,也可从已恢复告警数量了解当前告警跟进处理情况。
4.“资源排行 top 卡片”:
可配置关注资源,如主机运维可关注 CPU 使用率高的机器,配置主机及 CPU 使用率指标进行 top 排行展示,也可对服务类指标如成功率、时延等进行排行展示。
工作台现支持模板管理,可从界面直接定义工作台。以往为客户配置默认工作台视图需在配置中心进行,非界面操作,较为繁琐。升级工作台后,可在界面上直接进行“另存为”操作以生成模板,此操作由管理员进行。管理员可基于企业常用角色定义多个工作台模板,如针对主机运维、应用运维等不同角色,确定其各自可能关注的内容并进行模板配置。
将模板设置为全局默认视图后,用户初始化登录时可查看到该默认视图。普通用户定义个人工作台时,可进入编辑菜单选择从模板中加载,无需从零开始配置工作台,从而降低了使用门槛。
HyperInsight能力优化
-
APM支持按环境筛选
-
监控态势感知的蜂窝图按最高告警等级展示颜色
-
APM链路追踪的火焰图展示观测点信息
CMDB能力优化
-
架构视图支持配置跨多层关系的常用路径、支持关联系统、支持框选多个元素等多个绘制交互优化
-
入库审批的审批中列表支持查看“审批人”信息
-
资源自动发现:支持界面化配置基于eBPF的服务访问关系采集
-
资源自动发现:k8s服务发现默认不上报父服务
-
资源自动发现:k8s服务发现支持关联命名空间的服务集
DevOps能力优化
-
容器服务支持高级部署模式
-
发布单支持多次重新发布
-
应用部署:增加升级前后相关脚本的执行时选项
AutoOps能力优化
-
定时任务执行周期支持选择日历模式
-
工具库lib管理列表支持下载
-
流程库支持版本审批
-
超级流水线库管理(支持诊断、巡检流水线)
ITSM能力优化
-
处理历史及工单流程增加开关控制显示旧版/新版UI
-
为了提升ITSM产品性能,调整工单列表翻页功能,提供“首页/上一页/下一页”翻页能力,取消按页码进行翻页
-
工单详情显示服务关联单信息
系统管理优化
-
工作台:自定义入口卡片支持自适应高度、自定义入口在配置时支持拖拽排序等
- end -