观测云更新
观测云帮助文档目录更新
- 拆分更新日志目录,支持按年查看观测云的更新内容;
- 新增自定义开发目录,可查看自定义采集器(Pythond)、自定义安全巡检(Scheck)、自定义 DDtrace 等文档;
- 新增私有化部署目录,可查看观测云部署的相关文档。
新增 DEMO 工作空间查看入口
观测云提供工作空间 Demo 帮助您更好的使用观测云的各项功能模块。您可以点击左上角的「工作空间」,在弹出的对话框中点击「体验 Demo 空间」,即可进入 Demo 空间进行查看。
时序图新增事件关联分析
时序图新增的事件关联分析,支持通过“添加筛选字段”匹配与选定字段相关的异常事件,从而达到时序数据与事件关联显示的目的,帮助用户在查看趋势的同时,感知数据波动期间是否有相关事件产生,以实现定位问题。
- 时序图配置事件关联后,在时间轴上,若存在与选定关联字段(例如:“host:DESKTOP-NEN89U3” )相关的事件记录就会用阴影色块标注显示;
- 时序图配置事件关联后,在分析模式下,点击高亮的阴影色块,即可查看与选定字段(例如:“host:DESKTOP-NEN89U3” ) 相关的异常事件。
更多详情可参考文档 时序图 。
优化日志上下文
在日志详情页查看上下文打开新的日志查看器时,会以 “host”、“source”、“service”、“filename” 为筛选条件,查看当前日志时间前后的数据。
优化用户访问监测¶
新增自定义用户访问监测应用 ID¶
用户访问监测支持用户自定义应用 ID 作为当前工作空间的唯一标识(原观测云的应用 ID 是全局唯一,即不同空间的应用 ID 也不可重复),不同工作空间可使用相同的应用 ID 作为同一应用的唯一标识,用于 SDK 采集数据上传匹配。更多详情可查看文档:
新增用户访问监测网络请求 ERROR 错误关联链路查看¶
用户访问监测支持用户在RUM查看器中关联查看网络( network)错误的相关链路。更多详情可参考文档 查看器 。
智能巡检全面升级¶
- 智能巡检列表调整「分组」为「告警策略」,支持在编辑的时候为智能巡检选择告警策略;
- 智能巡检相关事件详情页全面调整,包括详情页相关页面,如基础属性、事件详情、根因分析、告警通知、历史记录、关联事件等;同时优化异常图表分析,新增数据关联跳转链接、异常区间提示、根因分析区间提示、图例显示操作等。
更多详情可参考 智能巡检 。
优化监控¶
调整分组为告警策略¶
在「监控」,调整「分组管理」页面为「告警策略管理」,通过新建告警策略筛选监控器以及设置告警通知。
在「监控器」,原「分组」筛选调整为「告警策略」筛选,支持在配置监控器时选择告警策略,支持点击监控器的告警策略修改告警设置。
优化监控器配置¶
-
调整监控器的配置流程步骤,包括检测频率、检测区间、告警策略等;
-
优化检测指标,支持配置外层函数(fx),包括「Label 筛选」、「转换函数」、「无数据填充」;支持切换到 DQL 查询模式;
-
优化触发条件文案提示;
-
优化事件通知,去除部分监控器自定义无数据事件标题和内容;调整模版变量提示文案;调整分组为告警策略,并支持编辑告警策略;
-
优化日志检测、应用性能指标检测、用户访问指标检测「检测指标」配置。
更多详情可参考 监控器管理 。
新增「基础设施存活检测」¶
「基础设施存活检测」用于监控基础设施的运行状态。更多详情可参考 基础设施存活检测 。
新增「进程异常检测」¶
「进程异常检测」用于监控工作空间内的进程数据,支持对进程数据的一个或多个字段类型设置触发告警。更多详情可参考 进程异常检测 。
注意:基础设施对象检测已去除,已存在的相关监控器可以继续使用,但不再支持新建。
优化「应用性能指标检测」¶
「应用性能指标检测」中新增「链路统计」检测方式,统计规定时间内符合条件的链路数量,当超出自定义阈值则触发异常事件。可用于服务链路异常错误通知。更多详情可参考 应用性能指标检测
优化成员管理¶
- 只读成员不再支持查看成员管理页面;
- 支持普通成员和 SSO 成员筛选过滤,SSO 成员仅显示当前已配置的身份提供商(IDP)对应的成员。
更多详情可参考 成员管理 。
其他功能优化¶
- 图表中指标聚合函数从默认的 last 变更为 avg,日志类数据聚合函数从默认的 last 变更为 count
- 优化时序图、饼图图例复制体验
- 优化笔记编辑模式下的交互显示
- 快照支持保存当前查看器的显示列信息
- 链路详情页针对时间的字段做格式化显示,把时间戳转换成日期格式显示
- 部署版管理后台支持修改工作空间的数据保存策略
DataKit 更新¶
Breaking changes¶
- Gitlab 以及 Jenkins 采集器中,CI/CD 数据有关的时间字段做了调整,以统一前端页面的数据展示效果
采集器功能调整¶
- 优化 IO 模块的数据处理,提升数据吞吐效率
- 在各类 Trace 上加上的磁盘缓存功能
- DataKit 自身指标集增加 goroutine 使用有关的指标集(
datakit_goroutine
) - MySQL 采集器增加
mysql_dbm_activity
指标集 - 增加 netstat 采集器
- TDengine 增加日志采集
- 优化磁盘采集器中的 fstype 过滤,默认只采集常见的文件系统
- 日志采集器中,针对每条日志,增加字段
message_length
表示当前日志长度,便于通过长度来过滤日志 - CRD 支持通过 DaemonSet 来定位 Pod 范围
- eBPF 移除 go-bindata 依赖
- 容器采集器中默认会打开 k8s 和容器相关的指标,这在一定程度上会消耗额外的时间线
Bug 修复¶
- 修复 DataKit 自身 CPU 使用率计算错误
- 修复 SkyWalking 中间件识别问题
- 修复 Oracle 退出问题
- 修复 Sink DataWay 失效问题
- 修复 HTTP /v1/write/:category 接口 JSON 写入问题
文档调整¶
- 几乎每个章节都增加了跳转标签,便于其它文档永久性引用
- pythond 文档已转移到自定义开发目录
- 采集器文档从原来「集成」迁移到 「DataKit」文档库
- DataKit 文档目录结构调整,减少了目录层级
- 几乎每个采集器都增加了 k8s 配置入口
- 调整文档头部显示,除了操作系统标识外,对支持选举的采集器,增加选举标识
更多 DataKit 更新可参考 DataKit 版本历史 。
最佳实践更新¶
-
云原生
-
监控 Monitoring
- 应用性能监控 (APM) - DDtrace 自定义 Instrumentation
- 应用性能监控 (APM) - DDtrace 观测云二次开发实践
更多最佳实践更新可参考 最佳实践版本历史 。