关于技术系统安全运行的三点看法

综合上午的沟通,有三个层面的看法吧。
1)让安全事件不发生:事前做好产品设计、技术规划、研发管理、质量控制、变更控制。比如产品设计上要多考虑安全应对和运营需求,技术上要增加安全运行开发比例比如没有监控模块系统不上线方面,质量控制增加“异常用例”构造,多从制造异常场景去测试和验证系统的鲁棒性。
2)让安全事件早发现:系统有安全运行阈值是一个很好的指标,重要的系统没有安全运行监控模块不予上线,可探索一下这方面是否有不上线一票否决制的可能;构建精通业务了解技术系统的运行/运营团队,让他们能担当起问题发生前的警报员和吹哨人;重要系统实施上线还要考虑做好灰度测试,有一句话叫能做到test on production, 而又不影响现行业务。
3)安全事件发生了能把影响降到最低:日常的应急演练是必不缺少的环节,这里一方面是练兵锻炼队伍,另一方面是促进团队内外的沟通,把异常极端事件通过演习的方式来压实组织的紧密性、提高团队协作和应变处突能力。技术系统的降级服务能力怎么样?技术系统的备选方案是什么?这是在实施技术系统时要规划考虑,技术系统的建设应急能力工作功夫在平常。对外信息的发布沟通的管理要有统一的口径和机制来协调。也建议:组织架构上常态化地建立起安全应急处置小组,专项分工负责日常应急演练、应急场景下的牵头处置、对外联络等工作。
仅供参考。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值