(一)事前检查和监控
1.服务器和网站漏洞检测,对Web漏洞、弱口令、潜在的恶意行为、违法信息等进行定期扫描;代码的定期检查,漏洞检查及服务器安全加固
2.服务器数据备份,包括网站程序文件备份,数据库文件备份、配置文件备份,如有资源最好每天备份。还需要定期检查备份文件是否可用,避免出故障后,备份数据不可用。
3.监控服务器常规状态CPU负载、内存、磁盘、流量,超过阈值告警,可以显示历史曲线,方便排查问题;还有就是服务器登陆记录,进程状态,有异常记录告警。
4.运维人员都要接收告警邮件和短信,至少所负责的业务告警邮件和短信必须接收,
5.除服务器内部监控外,最好使用第三方监控,从外部监控业务是否正常(监控URL、端口等)
6.网站避免SQL注入、网页挂马等漏洞威胁。建立应急预案机制,定期演练事故场景,估算修复时间。
7.操作重要业务升级、迁移、扩容……之前,列一下操作步骤,越详细越好,实际操作按步骤操作,操作完做好记录。
(二)事中操作
1.网站WEB增加WAF,发现XSS、SQL注入、网页挂马等攻击,会自动拦截,并记录日志。
2.检查服务器数据备份是否可用。
3.在处理需求和故障时,执行风险命令需再三确认,执行操作前,一定确认好再执行!
4.不要乱动数据库,避免在不清醒的状态下,在服务器上执行了错误命令,导致数据丢失或业务故障。
5.在处理事故时,一定要考虑处理措施是否会引发连锁故障,重要操作三思而行。
(三)事后检查分析
1.实现网络安全可视化管理,可以看到每天有那些异常IP和异常URL请求,服务器集群开放端口列表等。能对全网进行安全策略集中管理。
2.统一日志收集和分析。
3.备份及篡改恢复功能,程序文件、图片、数据文件、配置文件的备份,故障回滚机制。
4.对攻击日志进行深度分析,展现攻击路径、攻击源,协助管理员溯源。
5.践行DevOps的无指责文化,尤其是在做事故分析时。事故分析重在定位原因,制定改进措施。
服务器运维主要操作事项
最新推荐文章于 2022-03-09 14:56:25 发布