A. 智能运维纲要
概述
- 优势
- 大量的数据
- 具体的业务场景
- 条件
- 行业领域知识
- 算法知识:三个层面
- 独立模块
- 需要依赖于其他算法的
- 系统性问题
- 运维场景领域知识
- 工程挑战
- 没有高质量的标签数据
- 历史
- 手工运维
- 自动化运维
- 开发运维
- 智能运维
- 能力等级
- 尝试应用
- 单点应用
- 串联应用
- 能力完备
- 终极AIOps
AIOps构建思路
- 原子场景
- 相似场景或者相同场景平台化
- 不同类似场景的串联
- 更高级场景的串联,真正的AIOps
AIOps建模服务能力
- 数据输入
- 用户数据
- 样本库
- 数据准备
- SQL/表达式
- 代码编辑
- 分组
- 关联
- 分支路由
- 算法库
- 特征工程
- 机器学习
- 深度学习
- 时间序列
- 文本处理
- 模型构建工具
- 效果评估
- 统计分析
- 数据探索
- 参数调优
- 模型选择
- 计算任务调度管理工具
- 实时任务
- 离线任务
- API调用任务
- 交互式任务/交互式引擎
- AI模型应用
- 离线应用
- 实时应用
- API调用应用
常见应用场景
- 效率提升方向
- 智能变更
- 智能问答
- 智能决策
- 容量预测
- 质量保障方向
- 异常检测
- 故障诊断
- 故障预测
- 故障自愈
- 报警过滤
- 成本管理方向
- 成本优化
- 资源优化
- 弹性伸缩
- 容量规划
- 性能优化
常见解决方案
- 数据采集
- 硬件资源采集
- 业务数据采集
- 日志
- 服务状态
- 性能跟踪
- 数据存储
- 时序数据:时序数据库,例如 OpenTSDB
- 日志:分布式搜索引擎,例如 ElasticSearch
- 数据分析
- 异常检测
- 日志分析
- 日志标准化
- 日志事件提取
- 指标异常检测
- 日志分析
- 根因分析
- 模糊逻辑推理
- 故障预测
- 模糊逻辑推理
- 预测算法
- 异常检测
关联业务
- 报表系统
- 自动化测试平台