优维EasyOps®全平台又双叒叕上新功能了!
不瞒各位小伙伴
写今天这篇文章时
我的手一直在抖
是激动的,这次要介绍的更新太牛了
尽管鹿小U已经
非常认真地研究过这20多个新功能
仍然无法用文字描述出
这次功能批量上新
「厉害程度」的十分之一
啥也不说了
赶快和鹿小U一起往下看看吧!
HyperInsight 超融合监控
APM「服务详情」
支持查看服务的部署架构和依赖资源
提供服务故障立体分析能力
向下排查服务依赖资源的健康情况
服务故障/性能不佳的原因可能有很多,可能是服务逻辑有问题、可能是服务调用有问题,也可能是服务依赖资源故障导致的,如以下情况的出现:
⚠️ 服务的部署实例挂了,影响了服务性能
⚠️ 服务所在主机挂了,导致服务不能正常运行
⚠️ 网络波动,服务无法正常调用
故而需要去排查服务所依赖的基础架构的基础资源的健康情况,来快速解决服务故障问题。
在这之前,排查服务的依赖资源情况步骤繁琐,又需要切换多个小产品,下钻很多页面才能查看到实际想看的资源的指标数据。
为了解决下钻资源详情困难的问题,服务详情支持了查看部署架构和依赖资源的能力,用户可直接在「服务详情」里面快速下钻。该功能不仅支持快速浏览其「依赖资源」,还支持可视化查看「部署架构」,帮助用户快速查看服务依赖资源的健康状况。
该新功能具备以下特点:
-
使用one model 标准化模型进行建设,可拓展,更专业;同时也可联动CMDB资源,使用自动发现能力;
-
统一查看服务所依赖的三大类型资源,更全面,更快捷;
-
通过可视化拓扑下钻查看每个服务实例的依赖资源健康,图形化突出重点,下钻查看更具针对性。
通过「服务地图」的原有能力,查看服务调用,再加上此次「部署架构」新增能力,去查看服务所依赖资源的健康情况,帮助用户实现服务故障的立体化分析。
「套件采集详情」&「拨测采集详情」
支持指标图表化预览
在日常的运维中,可能会遇到如下两种场景:
-
启用了套件后,用户想查看资源指标有没有正常上报?指标上报数据是否正确?原来的操作是需要在基础设施监控查找并配置Dashboard,才能查看到指标情况,整个步骤比较繁琐。
-
启用拨测任务之后,用户希望观察近段时间的拨测任务情况,那原先查看原始指标的时候,不能很好的查看到拨测任务的一个变化情况。
为了解决以上两种场景存在的问题,新增加「指标图表化预览」的新功能,让用户在日常运维过程中操作更加便捷。
「指标图表化预览」具有以下特点:
-
按资源实例、按指标快速查看指标趋势图表
-
支持按时间顺序查看字符型指标
-
拨测采集的指标预览可进一步筛选拨测机和拨测步骤
「Dashboard」
支持自定义不同的默认时间范围
精确打造视图分析观测的时间窗口
当用户在自定义Dashboard的时候,不同分析视图的观测场景是不一样,比如:
-
在实时监控大屏,需要查看近1小时的观测数据
-
每日的服务访问情况
-
近7天的故障统计
-
近30天的资源占用情况
针对以上不同的观测场景,希望有一个固定的时间范围区间来查看。那此次产品升级之后,Dashboard微应用支持每个视图自定义默认时间范围,即用户可根据不同的数据分析场景设置合理的默认时间窗口,比如查看实时的监控指标数据可以设置为近1小时;查看资源最近告警情况可设置为近24小时等。当用户在访问Dashboard的视图时,都会按所设置的默认时间范围来展示数据。
CMDB
「资源自动发现」
支持服务间调用关系、K8s服务的发现
构造完整的服务东西南北向拓扑
在「资源自动发现」中,资源或服务的关系发现是关键。此次新增服务间调用关系的发现,使得「资源自动发现」的能力再升级,以「资源自动发现」现在的能力完全可以构造完整的服务东西南北向的拓扑图。
什么是东西南北向拓扑图?
从南北向来说,是指服务的整个部署架构拓扑所涉及的资源以及资源间的关系,都会自动发现回来;而东西向,是指以横面的服务调用拓扑来实现资源自动发现。此次,通过构造资源自动发现中完整的拓扑能力,为上层消费提供了更多可能性。
在CMDB平台的整个发展过程中,关系的维护方式在不断的迭代升级,从最原始的吭哧吭哧手工维护→【项目】吭哧吭哧写脚本做自动采集→【CMDB-服务发现】写服务特征进行分析→【APM】自动分析分布式链路追踪的trace数据→【APM】自动分析日志数据→再到如今【资源自动发现】智能扫描一键采集,可以看出,能力在不断提升,效率也越来越高。
目前,「资源自动发现」的能力涵盖的范围有:
-
资源类型:平台资源、计算资源、网络资源、服务资源
-
采集手段:远程扫描、Agent采集、对接云厂商、手动运维
-
数据类型:配置信息、关联关系(服务调用、部署架构)
其中,计算资源的发现填补了容器资源的空白;采集手段支持远程扫描降低了资源发现的门槛,支持对接云厂商填补了公有云资源的空白;在数据关系发现上,支持关联关系的发现,增强了关系发现的能力。
用户可升级6.10后试用资源自动发现的能力,未来优维将持续拓展发现的资源/服务范围。
「实例详情」优化关系展示
提高页面信息密度
由于UI8.0 第一版「实例详情」基本信息和实例关系采用了上下结构,页面容易出现双滚动条,页面利用率不高。
因此,此次对「实例详情」做了一个改版:首先是实例关系列表回到左侧;第二是基本信息按宽度自动调整三列还是两列布局;第三是基本信息分类采用悬浮样式,点击后页面自动滚到锚点位置,更方便用户查看。
ITSM
「表单设计」
支持容器拖动排序
表单设计更灵活
之前的「表单设计」在拖入容器后,容器之间的顺序无法更改,一旦容器顺序错误只能整个删掉重新做,对于用户来说使用十分的不便。
为了用户更灵活的使用,新增拖动布局的上下调整功能,即用户在设计表单的过程中可调整容器的上下顺序,操作体验就和组件一样,支持鼠标拖动,按住容器标题上下拖动即可。
「数组输入」
支持正则校验
提升表单填写准确性
用户在实际的表单填写里,经常会有通过「数组输入」填写多个 IP 这类场景,而之前「数组输入」组件并未支持正则校验,不能像普通文本输入一样校验格式是否正确。
此次升级后,在表单设计中,「数组输入」组件支持添加正则。需要注意的是校验对象是数组输入的每一个输入项,而不是整个数组。
「脚本库」
分类及数据优化仅展示ITSM脚本数据
脚本库数据更清晰
原先ITSM-服务管理-脚本库管理中包含的脚本信息除了ITSM,还有其他分类的脚本信息,存在许多ITSM用不到的脚本,也汇聚在该模块下,造成用户管理、维护脚本低效、不够方便的问题。
此次对ITSM「脚本库」进行优化后,「脚本库」中的脚本仅保存与ITSM相关的脚本,简化了脚本数据,方便用户更高效对「脚本库」进行管理。
「高级设置-文案设置-常用语设置」
取消提示语三个限制,支持更多常用语设置
常用语设置更加灵活
原先高级设置-文案设置-常用语设置最多只能设置3个,当常用语超过3个时无法再新增,客户无法根据需求自定义更多常用语。
因此,在最新的产品版本中,取消了常用语最多只能新增3个的限制,即用户可设置3个以上的常用语。此外,页面会默认展示5条常用语,超过5条折叠进“更多“,展开更多后即可查看其他的常用语信息
「实例选择组件」
支持按升序、降序等排序
完善【实例选择】组件基础功能
原先「实例选择」组件不支持排序功能,用户无法快速筛选、查看关键数据。
优化之后,「实例选择」组件新增排序功能,支持升序、降序、取消排序。如果数据量较大,用户可通过排序功能,提高数据检索的效率。
「工单中心」
导出新增工单详述内序
丰富工单导出内容
原先「工单中心」导出没有工单论述内容,用户在导出表格中看不到工单论述相关信息。那在最新的版本中,「工单中心」导出工单支持导出“工单论述“信息,丰富了工单导出的内容
DevOps
「数据库变更」
支持对高危sql语句检测并限制发布
更安全的执行数据库变更,规避删库
当前「数据库变更」时,平台对sql脚本从内容安全侧来说,缺失了一种检测能力,当发生某个sql脚本中存在删除数据库的sql语句时,很容易由于人工审查的问题导致发布事故。
为了用户更安全的执行「数据库变更』,规避删库的风险,数据库变更新增了对高危sql语句检测并限制发布的功能,即用户可以在「数据库变更—变更配置」模型中设置高危语句,且可以对高危语句进行分级,如fatal级(drop database)限制发布,warning级(修改变更数据库)需人工确认。
此次对「数据库变更」的优化,在能力上给用户提供了更多维度的选择,非强制,若部分用户在使用数据库变更时,无该使用问题,可以通过不配置该模型实例,正常发布即可。在流水线执行数据库变更的场景中,支持通过接口返回给流水线来限制,使用方式上更加灵活。
「数据库变更」
支持对文件md5码的校验
增加执行过程中的校验管控
解决不规范操作带来的后续管理问题
数据库执行变更遇到发布错误的文件时,客户现场存在着这样一种操作方式:用户将平台下发到客户端的sql文件通过在客户端更改文件内容的方式,来解决发布时遇到错误的问题,这种方式本质上造成了计划发布与实际发布对象的偏离,对于用户后续回溯问题,造成不易察觉的隐藏问题。
平台通过对待下发文件与下发到客户端文件的md5码的校验,以保证用户在进行发布时,预计发布与实际执行的过程中,对象的一致。在用户进行发布报错文件重试时,或再次执行时,若出现md5不一致的文件,平台将会报错,并终止本次发布。此次,通过对执行过程中的校验管控,可解决因不规范操作带来的后续管理问题。
「应用部署」
应用配置、部署策略相关页面
支持主机排序
高效的筛选、检索主机信息
原先在「部署策略」、「应用配置」选择发布目标时,若主机数量过多时,缺少排序功能,无法对主机进行快速筛选、检索。
此次优化之后,支持在「部署策略」选择发布目标环节对主机进行自然排序,可升序、降序、取消排序;支持在「应用配置」树状分类支持对主机进行自然排序,可升序、降序、取消排序。
「制品库」
支持版本清理策略
对于「制品库」的清理,常规的做法是清理掉一些不重要的版本。那此次「制品库」新增的版本清理策略,清理方式更丰富,支持以下4种清理方式:
-
支持配置不同类型制品
-
支持配置制品保留规则
-
支持定时执行清理
-
支持版本白名
AutoOps
「流程库/作业」
导出导入自身及关联工具信息
流程及关联工具一键导出/导入
原先「流程库」的导出/导入仅支持流程自身的信息导出、导入,而无法将其关联的工具一同导出、导入,用户需要分别对流程及其工具单独导出、导入,然后在进行手工关联,操作路径长、复杂,成本极高,而且往往容易出错。
「作业」的导出导入同理。
优化之后,支持在流程纬度和作业维度,对流程和作业及其关联的工具一键导出/导入,实现跨平台间的流程/作业导出、导入,极大提升了用户对作业、流程、工具的使用效率,减少了用户手工操作的成本。
丰富/完善运维自动化
运维作业权限点配置
权限点配置更加灵活
原先运维作业不同菜单支持配置访问和管理权限点,但是因为管理权限点过粗,无法满足用户更精细化的权限点配置需求,如执行、编辑、克隆等。
为了解决上述问题,对运维作业管理权限点进行拆分,支持更细颗粒度的权限点的配置,如访问、执行、编辑、删除、新建、克隆、高级设置。
工具库「任务历史列表」
新增”执行参数“字段
原先「工具库任务历史」中的“执行参数“只能在任务历史详情里查看,用户要查看任务的执行参数,需要一条条点进去查看,操作路径较长,不够方便。
对此,工具任务历史新增“执行参数“字段,用户点击查看后,可在当前页面查看“执行参数“内容。
工具库「对象引用」
支持查看更多引用类型
原先「工具库对象引用」列表,只显示引用工具的流程信息,却没有展示引用工具的其他对象信息,如流水线、作业、定时任务等。
此次优化之后,工具库对象引用列表支持查看引用工具的所有对象信息,如流程、流水线、作业、编排方案等。
「运维作业」新增全局搜索框
支持全局作业搜索功
原先运维作业不支持在全局进行搜索,需要点击每个菜单后,在菜单内在进行搜索,操作路径有点长,效率不够高。
新增全局搜索功能之后,支持对所有菜单所有作业进行搜索,在一定程度上提升了搜索的效率。
3D架构拓扑可视化
应用性能管理支持自动发现的服务之间调用关系,并且通过服务地图将服务之间的调用关系,以可视化的形式展示出来。然而,在实际的业务场景中,当出现大量数据的时候,其信息的展示形式并不理想,主要存在着两方面的问题:
❗第一个是数据结构比较复杂,页面广度受限,需要拓展空间单位面积内呈现的信息量太少,大部分信息都超出了屏幕之外。
❗第二个是节点密集时无法看清节点之间的调用关系,调整视角总览数据的关联关系时又很难看清单个节点类型。
针对以上两点,优维提出了运用3D技术来优化数据的展现形式,挖掘数据的价值。
首先,「3D架构拓扑设计方案」相较于现有的方案,可以有效的提升单位面积内所呈现的信息量,并且由于3D多了一个维度展示的空间,数据中拉开了视觉层级,避免了因数据体量增大,带来的视觉干扰。
此次对「3D架构拓扑图」主要优化了一下三个方面:
✅ 第一是,区别了节点的类型,将展现形式变为3D节点,更加准确地表达了节点所代表的类型。
✅ 第二是,数据调用以可感知的形式来展现,选中节点连线,加入流光的动效,这样节点的关联关系过载的情况下也能确保内容清晰。
✅ 第三是,针对于异常节点采用了更优雅的展现形式,对可能出现的报错变更,在节点上有动态提示。
其次,在设计风格上「3D架构拓扑图」采用轻质感的设计风格,整体层次简单,用色素雅干净,采用轻投影,轻渐变的方法设计,具有一定的立体感,能给人轻盈、简洁、精致的感觉。同时,使用塑料材质,体现出轻量化和品质感。
为了保证模型设计的一致性,同时方便对模型进行灵活的复用,在空间中规范了模型格局的大小,模型的分段数,模型尺寸和布局,以保证所有物体都具有强秩序且便于组合设计。
同时,在渲染3D节点的时候,也适配了浅色和暗黑两种主题模式。在实际业务场景中浅色更融入页面,更温和,推荐使用浅色模式。而暗黑模式是一种夜间友好的颜色主题,帮助用户更沉浸式的工作,推荐大屏展示。
以上就是对3D架构拓扑图整套方案的优化,这套方案中不仅对节点的模型进行了优化,对连线以及告警,加入视觉和动效的表达,使其展现形式更富有趣味性。