观测云更新¶
新增智能巡检功能¶
智能巡检基于观测云的智能检测算法,支持自动检测基础设施和应用程序问题,帮助用户发现 IT 系统运行过程中发生的问题,通过根因分析,快速定位异常问题原因;通过观测云的智能预测算法,帮助用户提前预见基础设施和应用程序的潜在问题,评估问题对系统运行的影响等级,更好的确定排障工作的优先级,减少排障过程的不确定性。
智能巡检目前支持三种巡检模板:
- 内存泄漏:检测当前工作空间主机是否存在内存泄漏问题
- 磁盘使用率:检测当前工作空间主机的磁盘是否存在使用率过高问题
- 应用性能检测:检测当前工作空间服务 QPS、平均响应时间、P90响应时间以及错误率是否存在波动变化
优化查看器搜索和筛选功能¶
1.查看器搜索新增「not wildcard 反向模糊匹配」,即不匹配模糊查询结果。
2.查看器快捷筛选新增空间级和个人级筛选方式
- 空间级筛选项:由管理员/拥有者进行配置,点击快捷筛选旁的「设置」按钮,即可配置空间级筛选项
- 个人级筛选项:所有成员都可以配置基于 「个人+浏览器」的快捷筛选项,点击快捷筛选右侧的「编辑」,即可配置个人级筛选项
更多详情可参考文档 查看器的搜索和筛选 。
新增修改 URL 中的时间范围进行数据查询¶
观测云支持在浏览器的 URL 中直接修改当前工作空间查看器/仪表板的 time
参数的时间范围进行数据查询,支持秒、分、时、天 4 种单位,如 time=30s、time=20m、time=6h、time=2d 等,如下图所示在浏览器修改 time=2h
,查看器展示最近 2 小时的数据。更多详情可参考文档 URL 的时间范围 。
新增仪表板视图变量日志、应用性能、用户访问、安全巡检数据来源配置¶
仪表板视图变量新增「日志」、「应用性能」、「用户访问」、「安全巡检」数据来源配置,同时优化仪表板新建和编辑视图变量的交互。
- 在未添加过视图变量的仪表板,顶部导航栏增加「添加视图变量」按钮,点击即可添加视图变量
- 若仪表板已添加过视图变量,顶部导航栏下面会直接显示视图变量名称,点击右侧「编辑」按钮,即可进入视图变量编辑页面
更多详情可查看文档 视图变量 。
优化图表查询交互¶
- 点击图表和查询中间的「分隔条」即可上下拖动
- 点击查询语句左侧的「拖拽」按钮,上下拖动即可调整查询的顺序
- 滚动条仅作用于查询语句区域,不影响图表
新增用户访问指标检测事件通知模板变量¶
在「用户访问指标检测(RUM)」监控器中配置通知事件,除了通用的模板变量外,额外支持下列模板变量。更多详情可参考文档 事件标题、内容模版 。
模板变量 | 类型 | 说明 |
---|---|---|
app_id | String | 应用 ID |
app_name | String | 应用名称 |
app_type | String | 应用类型 |
优化事件内容一键打开链接¶
配置监控器时,在事件内容添加链接,当触发事件后,在事件详情页的「事件内容」,点击链接即可打开新页跳转页面。
DataKit 更新¶
- prom 采集器的内置超时时长为 3 秒
- 日志相关问题修复:
- 添加日志采集的
log_read_offset
字段 - 修复日志文件在 rotate 后没有正确 readAll 的 bug
- 添加日志采集的
- 容器采集相关问题修复:
- 修复对环境变量
NODE_NAME
的不兼容问题 - k8s 自动发现的 prom 采集器改为串行式的、node 分散采集
- 添加日志 source 和多行的的映射配置
- 修复容器日志替换 source 后还使用之前的 multiline 和 pipeline 的 bug
- 修正容器日志,设置文件活跃时长是 12 小时
- 优化 docker 容器日志的 image 字段
- 优化 k8s pod 对象的 host 字段
- 修复容器指标和对象采集没有添加 host tag 的问题
- 修复对环境变量
- eBPF 相关:
- 修复 uprobe event name 命名冲突问题
- 增加更多环境变量配置,便于云 k8s 环境的部署
- 优化 APM 数据接收接口的数据处理,缓解卡死客户端以及内存占用问题
- SQLServer 采集器修复:
- 恢复 TLS1.0 支持
- 支持通过 instance 采集过滤,以减少时间线消耗
- Pipeline 函数
adjust_timezone()
有所调整 - IO 模块优化,提高整体数据处理能力,保持内存消耗的相对可控
- Monitor 更新:
- 修复繁忙时 Monitor 可能导致的长时间卡顿
- 优化 Monitor 展示,增加 IO 模块的信息展示,便于用于调整 IO 模块参数
- 修复 Redis 奔溃问题
- 去掉部分繁杂的冗余日志
- 修复选举类采集器在非选举模式下不追加主机 tag 的问题
更多 DataKit 更新可参考 DataKit 版本历史 。
最佳实践更新¶
更多最佳实践更新可参考 最佳实践版本历史 。
------------------------------------------
“观测云”是一款面向开发、运维、测试及业务团队的实时数据监测平台,能够统一满足云、云原生、应用及业务上的监测需求,快速实现基础设施、中间件、应用层和业务层的可观测。基础设施监测、日志与指标管理、应用性能监测、用户访问监测、可用性监测、异常检测、系统级安全巡检、场景和仪表板等是“观测云”的可观测解决方案,通过统一的数据采集、全面的数据监控、无缝的关联分析、自定义的场景搭建、高度的可编程性,敏捷的成员协作,为用户提供了最快、最轻松、最全面、最自由的系统可观测平台。