笔记
文章平均质量分 67
harryho
这个作者很懒,什么都没留下…
展开
-
2021-04-22 扩容是稳定性保障终极大招?
起因前文提到我们在活动期间系统“挂了”20分钟,为了保障下次活动不“挂”,在产品和研发的指导下对应用系统进行扩容,扩容数量先按当前资源的一倍靠齐。扩容真的能解决问题吗?假设我们都是不差钱,不需要考虑roi扩容在某些场景下非常有效,但在某些场景下就是就是杯水车薪。那在那些场景下有效呢?代码的响应时间比较低,最多不超过200ms,且并发请求远大于CPU数量时,增加CPU,有效。线程在没有挂起,阻塞,死锁的情况下,线程数量不够,通过增加线程数量(本机内存足够的情况下,调整参数增加线程;横向增加实例原创 2021-04-22 23:45:32 · 124 阅读 · 0 评论 -
2021-04-15 kk日记,415系统支持战况总结
背景今日公司进行面膜新品发布,新品分享有奖裂变活动,活动效果很好,异常火爆,可是系统很不争气挂了20分钟,作为系统支持的负责人觉得很惭悔,夜不能眠,在进行深深的自省。过程回顾作为系统支持负责人我是有一套系统稳定支持的理论:活动方式/内容的理解活动风险的评估活动所需资源的评估活动产品基础数据在系统核对redis扣库存生产验证活动核心链路压测服务台的故障时的指引与术语限流的制定慢URL的梳理应急措施的制定集思广益的风险梳理活动前24小时变更冻结现场支持人力锁定为什么还是挂原创 2021-04-16 02:14:25 · 1082 阅读 · 0 评论