整体理念
最近接了个活,可能需要写一套私有云的云管平台,简单梳理了下思路,我认为所谓的云管平台,即是将传统的数据/资产运维管理,转变为数据/资产的运营,所以主要操作还是以展示和反馈为主。
资源管理
多维度资源概览
| 旨在多维度展示云资产,无需涉及详细数据,详细数据来自于CMDB,基本覆盖全部资源
[ecs, cpu, mem, disk ,nas, oss, es, rds, redis, kafka…]
- 云维度
- 部门维度 (域)
- 项目维度 (工作区)
- 环境维度
- 自定义维度
资源审计
| 补足CMDB的审计功能,定时发送给各业务负责人以及资产使用人,进行自动化资源审计,避免出现云资产/IT资产无人认领的情况。
- 自动触发定时云资产的季度审计
- 手动触发指定资产的审计
软件MA审计
| IT资产的软件MA,证书,服务EOL等的管理,避免因为软件MA到期,导致出现服务不可用的情况
- 多类型支持- [ 证书,MA, 服务EOL]
- 自定义设置到期提醒 - [ 时间,通知方式 ,通知人]
自动化运维
资源交付
| 当前自动化任务为纯后端服务,缺少手动重试机制,以及对应状态前端展示等功能,相关配置需要后端配置文件&数据库进行修改
- 接入当前的自动化资源交付平台
- 相关配置属性字段可配置
- 状态可视化
- 如因参数错误导致创建失败,相关运维负责人可以手动修改参数后,点击重新创建
任务管理
| 当前脚本&定时任务分布在各个服务器上,无法统一管理,基于分布式的任务平台,可以将infra的内部任务统一进行管理和存放,如DBA的定时备份,部分业务的特殊监控 ,主机的初始化操作等日常操作,可以进行脚本的固化,这样可以更好的将脚本进行迭代和升级。
- 分布式任务管理和调度
- 支持定时任务
- 脚本语言支持python&&shell
备份管理
| 部分重要数据目前以异地备份的方式存放,存放方式为本地文件—> 异地oss
- 展示每日备份情况
- 自定义新增异地备份文件配置,包括限速带宽,备份时间等
资费管理
账单总览
| 优化分账账单逻辑,支持公共资源分摊,多维度展示当前云资源的费用使用情况
- 云维度
- 部门维度 (域)
- 项目维度 (工作区)
- 环境维度
- 自定义维度
趋势分析
| 多维度展示费用使用趋势,多维度展示当前云资源的费用使用趋势
- 云维度
- 部门维度 (域)
- 项目维度 (工作区)
- 环境维度
- 自定义维度
容量管理
资源优化
| 基于监控数据,设置优化条件,满足条件的定时触发回收/缩容建议报表,另外设置白名单,在内资源不参与资源回收。
- 基于监控数据,自定义回收条件[ep: 月度cpu峰值,内存峰值等]
- 通知模版定义
- 白名单设置,白名单内资源不参与资源回收
- 支持回收/缩容等多个优化方式
- 统计记录,展示月/年等维度,基于资源优化,总计节省了多少资源
大屏
成本大屏
- 总体费用趋势
- 多云投入情况
- 部门成本投入饼图
资源地图
- 资源申请工单量
- 多云资源部署情况
- 资源数量统计
- 资源使用趋势
- 部门使用资源饼图