![5cc78cfd162da4aa5363c7b58be44040.png](https://i-blog.csdnimg.cn/blog_migrate/d5eca7ec3fd5d830d082bc40ce6df2c6.jpeg)
作者系腾讯反入侵团队jaylam。本文围绕洋葱系统的实时质量建设和优化,介绍混沌工程在其中的初步实践应用。
在繁杂的业务和网络环境下,在公司百万级服务器面前,要做到入侵发生时的及时检测,那么反入侵系统的有效性,即系统质量,是至关重要的。
洋葱系统是腾讯公司级的主机反入侵安全检测系统,它是实现了前端主机agent及后端分布式数据接入分析系统的一整套服务,覆盖的系统模块众多,部署的服务节点超百万,面临的业务网络环境区域复杂——洋葱就是在这样的环境下进行实时监测数据的采集、上报和分析。
然而我们发现,在实际的运营过程中总会出现组件异常、未部署、入侵漏水等一系列质量上的挑战。
基于此,我们在对洋葱系统进行实时质量建设和优化的同时,提出了引入混沌工程的解决思路,并介绍混沌工程在其中的初步实践应用。即,建设整个系统实时质量的一个模型标准和稳态描述,结合实际入侵场景和服务异常的模拟进行混沌实验,对系统的稳定性、可用性进行验证,同时发现未知的质量问题,以此形成负反馈闭环,进一步推进反入侵质量建设和优化。
本文围绕洋葱系统的实时质量建设和优化,介绍混沌工程在其中的初步实践应用。
一、腾讯反入侵面临的极大挑战
要说明反入侵具体的工作内容,则要先对“入侵”进行定义。
这里的入侵主要指“未经授权”的行为。一般来说入侵者实施入侵行为,主要目的有以下几点:
- 获取敏感数据,如关系链,用户信息等;
- 篡改数据,如恶意删除,给自己账户充钱,篡改主页(just for fun)等;
- 控制个人资产,如将个人机器当肉鸡,对外发起DDoS攻击,或者当做渗透其他目标的跳板;
- 挖矿行为。
![4e734bf98e42230bd47179c012f0c67d.png](https://i-blog.csdnimg.cn/blog_migrate/f72ed637f12c04836af9a0682ce0cc71.jpeg)
从路径上看,黑客可以