故障预案

最新推荐文章于 2021-04-11 21:23:16 发布

艾比aibi

最新推荐文章于 2021-04-11 21:23:16 发布

阅读量914

点赞数

文章标签：事故

会议已经开完，并且梳理出下列几个方面的规划：

1. 事故处理预案

从最近几次事故看，我们业务是被动型业务且行业用户量不大，自身很少出现高负载，基本上是恶意访问。

故事故发生时按照下列步骤快速响应：

(1) 预先建立运维、新房、二手房、基础部应急处理群

(2) 有事故发生第一时间通知各负责人，各负责人必须第一时间召集本部门人员进行停止所有工作进行处理；

(3) 检查GW入口网络各项负载指标 -- 运维负载

- 分工：专人负责盯监控，专人负责运维操作，实时喊出监控变化和所作操作

(4) 个业务负责人检查各业务状态 -- 个业务模块负责人

- 专人负责检查服务器负载，定位异常服务

- 每个模块负责人报出自己模块的访问量(Throughput)和响应时间(Latency)情况，平时应该多少，现在是多少。

(5) 15分组后未定位问题，必须采取强制措施

- 封IP -- 运维

- 暂停服务 -- 个模块负责人

- 重启DB -- 运维

2. 运维监控告警

我们目前的事故都是靠线下反馈才知道，缺乏有效及时的监控预警机制，因此监控和告警非常重要。

下列监控和告警须先做起来。

(1) GW入口网络的IP段频繁访问告警

(2) 连接数告警

(3) 数据库告警 (已有-Review完善)

(4) 各服务器负载告警 (已有-Review完善)

(5) 业务层面告警 (业务部门配合开发，下周一前给出时间点)

2. 业务层面优化

（1）监控：每个业务需监控

- Throughput

- Latency

- 错误率

(3)其他改进

- 日志规范

- 压力降级

- 告警

3. 安全认证

(1) 我们的APP有被模拟嫌疑，我们需对自己的APP接入进行认证 (你采用亚马逊AWS方案**** 给出方案，并进行培训 - 下周三 )

(2) Web安全认证待讨论 - 请其他人给出方案。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
故障预案

会议已经开完，并且梳理出下列几个方面的规划：1. 事故处理预案从最近几次事故看，我们业务是被动型业务且行业用户量不大，自身很少出现高负载，基本上是恶意访问。故事故发生时按照下列步骤快速响应： (1) 预先建立运维、新房、二手房、基础部应急处理群 (2) 有事故发生第一时间通知各负责人，各负责人必须第一时间召集本部门人员进行停止所有工作进行处理；
复制链接

扫一扫

艾比aibi CSDN认证博客专家 CSDN认证企业博客

码龄10年

117: 原创

8万+: 周排名

12万+: 总排名

41万+: 访问

: 等级

4684: 积分

24: 粉丝

24: 获赞

8: 评论

78: 收藏

私信

关注

热门文章

分类专栏

电商系统架构 2篇

最新评论

为什么要使用base64编码
JW198812323: Fuck you
jvm 启动参数设置
种下星星的日子: 内存这部分很重要，感谢分享
jvm 启动参数设置
傲哥哥: 楼主这句话跟很多地方说的可不一样哦。求关注： “新生区由于对象产生的比较多并且大都是朝生夕灭的，所以直接采用标记-清理算法。而养老区生命力很强，则采用复制算法”
javaagent 使用以及陷阱
menghuanguaishou: 你好，能不能帮看下这个问题，和javaagent使用有关的 http://bbs.csdn.net/topics/392064759
在相邻元素相差1的数组中查找某一特定元素第一次出现的位置(非遍历)
zwjcxj: 多谢楼主的分享~

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。