本文转录自:拥有10余年架构师经验的高驰涛,在云智慧AIOps社区第4期Meetup上进行的《普通程序员向架构师进阶之路 》分享。
PPT及回放地址: 线上Meetup第4期|普通程序员向架构师进阶之路(内含PPT下载及回放) - 云智慧AIOps社区
架构师都在干什么?
两个实例看架构师们的日常
实例一
困扰整个团队⼀个⽉的诡异事件
- 数据库中偶尔会出现重复的两次/多次重复数据
- 运营/运维在发飙,客户经理连续道歉了N次
- 研发检查代码,没有发现异常
- 研发排查log,⽣产系统没有打INFO,遂开启并观察
- ⼀周后的某天下午果然⼜出现了⼏条不同客户的重复数据
- 研发排查该时间前后log,发现了重复数据写⼊的log
- 架构师拿出系统架构图进⾏标记
- 重复log总是出现在负载均衡器后的不同实例中
- 修改Nginx对反代超时的判定与实例超时判定相同
- 诡异事件不再发⽣
实例二
系统稳定运⾏⼀段时间后总要重启⼀次
- 为了应对该情况,运维复制了另外两套集群,三班倒的保障
- 研发排查log和源代码,有⼀堆明显异常,但不知道哪个是起因
- 纠集上百位系统管理员进⾏会诊,⼀周未果,“不是我啊”
- 三名架构师
- 通过APM探针,准确地得到了⽣产运⾏时的应⽤拓扑
- 配合CMDB,将运⾏时拓扑与系统拓扑合并,发现外部API
- 配合基础监控数据,将运⾏时状态、log与上述拓扑合并,得到指标体系
- 数据分析得到故障传播图
- 打卡应⽤ -> ⼈脸识别API -> MQ -> 接驳该MQ主题的其他系统
- 将打卡应⽤使⽤的MQ单独部署,增加⼈脸识别API的容错时间及本地验证后缓存
实例一涉及到的研发工程师有40+位,实例二涉及到的系统管理人员有上百位,而真正起到的关键作用的只有其中几名架构师和架构师的系统管理方法。
架构师的类别
业务架构、技术架构、系统架构 解决方案架构、基础架构、软件架