新财年,随着公司 IT 架构的复杂和应用数量的不断追加,运维工作愈发繁杂。在更新自身知识体系的同时,寻找更优的解决方案成为运维主管老凡的重点突破方向。
最近公司要上线新产品,开完需求沟通会议后,老凡打开了自己的工作日记,写道——
3月5日 周一 工作日记
新产品主要功能:监控网站 PV 和网页加载时间,并做基于浏览器、运营商、省份地域等的多维度分析、降噪处理及实时展现。
运维重点:
提升系统故障时日志的搜索速度,提升工作并做好云备份。
增强系统对日志的分析能力,挖掘数据价值,快速发现故障原因。
由于目前系统做了高可用和后端的均衡负载,老凡发现:因为当前服务器存储有限,均衡负载会随时切换服务器,导致系统日志无法统一存储,这将严重影响故障发生时的日志搜索,降低工作效率;在对日志的分析上,因为免费分析工具的耗资源、不稳定、速度慢等缺点,老凡开始考虑是否要额外采购一套分析工具。此时,他想起了不久前赵总在微信时提到的“智能运维”: