例如通过 Python 来写相关的自动化巡检脚本, 采集相关的性能指标数据, 制定相关的告警规则, 在触发预警规则的时候自动发送相关的邮件. 同时自己定义轮询周期和时间间隔.
自动化对提升我们工作效率至关重要, 特别是对于程序员更加应该具备自动化思维, 即不要在完全重复的事情上面浪费时间, 也就是在编程思维里面我曾经谈到的一个关键内容.
1. 将完全重复的事情自动化掉.
2. 将相似或有共性的事情先抽象和模板化, 然后再进行自动化.
对于第一点相信很多人都能够做到, 最难的还是在第 2 点, 即如何去发现哪些是相似和具备共同特征的事情, 并对这些事情进行抽象, 在抽象后进行模板化和参数化, 然后再自动化. 而这个往往考验的就是一个人的抽象能力和建模能力, 当然也是考验你认知和分析事物的能力.
最近工作, 我们来看哪些工作是可以考虑自动化掉的内容.
IT 基础设施环境, 应用的日常巡检工作
为何有了统一的 IT 网管, 或 APM 监控平台还需要做日常巡检? 这个主意还是当前的 IT 网管或 APM 无法对所有我们关心的指标做到实时监控, 特别是一些和应用相关的个性化指标. 那么这些内容往往就需要我们自己去监控. 实际做法应该是了解清楚我们当前人工是如何做该事情的, 然后在将人工做的内容自动化和脚本化掉.
来源: http://www.tuicool.com/articles/2uaEfqU