原文地址:http://blog.sina.com.cn/s/blog_87ace1a00101kp0y.html

产品运维建议初步整理:

1.要有专门的人负责运维,至少当非开发人员发现问题时,能够在第一时间找到问题处理人。

2.每天定时查询服务器的运行状态,至少早上上班时和晚上下班前两次;每天下班前发送“日常运维报告”邮件给主要关系人;每周整理一次“周运维报告”,统一当周系统运行情况。

3.提供部署手册、运维手册和操作手册;提供系统升级部署文档规范。

4.整理该产品常见问题的解决方法日志,当遇到不能解决的问题时,要根据问题的严重性,给出处理时长;并将后续的常见问题解决办法持续集成。

5.准备应急预案。当发生异常情况时,要能快速找到明确的问题负责人和问题解决人员;尽快确定问题的处理方式,并将处理结果通知给问题发现者和问题关系人。

6.可以开发一个简单的系统监控程序。检查服务器、软件、数据库的状态,第一时间将异常以邮件或其他形式通知给相关负责人员,提高应急处理能力,减少投诉量。

运维手册主要包含以下内容:

1. 系统运行环境

1.1 硬件(服务器品牌、型号、CPU颗数、CPU主频、内存大小、硬盘大小、网卡块数)