分布式系统中时序的重要性

最新推荐文章于 2022-10-27 16:44:49 发布

fullsail

最新推荐文章于 2022-10-27 16:44:49 发布

阅读量4k

点赞数

文章标签：服务器邮件服务器游戏破解任务工具

本文链接：https://blog.csdn.net/fullsail/article/details/4013929

版权

分布式系统中时序的重要性

本文是我们组前2天讨论交易邮件的处理流程过程讨论过程的总结。

交易邮件就是用户在拿取附件的同时，必须付给发件人指定的相应的报酬的邮件。

由于Pets是一个全区全服的游戏系统系统，邮件服务器可能有多台，不同的用户的邮件存放在不同的邮件服务器Mailsvrd 上。

假设的场景都是用户B发送交易邮件给用户A，用户A如果同意交易，则在拿取附件的同时，要按照用户B的要求数量给用户B发送一封付款（Pets的货币名称是元宝）邮件。用户A的邮件数据在邮件服务器Mailsvrd A上，用户B的邮件在邮件服务器Mailsvrd B上。另外客户端不直接链接Mailsvrd，而是通过接入层的Fedsvrd进行游戏。

图1 邮件系统架构

1 “正常”思维的方案

最开始的方案如下图，这是一个典型的“正常”思维的过程，处理的时序思路就是按部就班。

这个过程基本思路就是客户端在请求拿取附件后，前端的养成服务器负责处理整个流程，和后面的2个Mailsvrd服务器交互完成处理。

图2 正常的拿取邮件请求

如果用户正常，这个事情也没有任何问题。但是……，中国的用户都是不正常的。假如用户破解客户端或者直接修改协议进行发送，（Sniffer这类工具都有这类功能）。那么用户可能在第一次请求拿取附件后，再发送一条拿取附件请求。如下图，注意中间的那条蓝色的线。

图3 用户攻击导致服务器异常

这个请求，在服务器上一般会新开一个处理单元（线程或者事务处理对象）对这个请求进行处理。那么很可能（触发你有复杂的保护代码和回滚逻辑）导致一个结果是可以多次获得邮件附件。

2 加入事务锁

发现这个问题后，进行了思路的改变。我们要保证用户在一段时间内只能发起一个这样的事务。

事务锁可以加在前端服务器（面向客户端），但是考虑到前端服务器的有很多个点，锁的控制点放在后面的控制点。

觉得必须在Mailsvrd上增加一个拿取附件的事务，同时对这个事务增加事务锁。

改造后的时序变成了如下：

图4 加入事务锁的时序

这个方法是在用户A拿取附件请求Mailsvrd服务器的时候，Mailsvrd服务器对这个用户的拿取行为进行加锁。如果用户A再有任何拿取请求都拒绝。

事务锁本身就是一个限制检查，不是阻塞类型。所以对服务器的性能没有影响。

3 如果有天灾人祸

这样的确安全了很多，但是由于是分布式系统，任何一个节点都可能坏掉，天灾人祸是避免不了的，那么假如Mailsvrd B服务器坏掉了呢？

有两种糟糕可能，部分用户倒霉或者部分用户可能得到可以利用的漏洞。

假如你的代码时序就如同加入事务锁的时序，那么Mailsvrd B 请求失败的情况下，用户B将无法得到应得的元宝。另外假如你的时序和前面的方案略有差别，仅仅改变了修改邮件A状态以及给用户B邮件的时序前后关系，结果。结果会如何呢。这要看你如何处理Mailsvrd B返回的失败了。如果你在失败的情况下没有回滚操作，而且没有继续后面的操作到Mailsvrd A上修改邮件的状态，那么就可能导致用户A在这段时间内都能利用这个漏洞反复获得邮件内部的物品。

图5 天灾人祸

所以在分布式系统的多阶段（可以理解为有限状态机）的处理过程中，一定要考虑超时处理以及错误处处理。后面我们再来慢慢分析这些问题。

4 把危险的操作放在前面

再回头看看2种情况，先到Mailsvrd A服务器上处理修改邮件状态，还是先到Mailsvrd B上发送邮件。这的确是一个问题。

危险的操作步骤放在前面操作，主要的目的是在出现错误后避免处理更多的回滚操作。【注】

【注】危险操作步骤尽量放在前面完成，这应该算一个准则，但也要明白的是一切准则都有例外。

所以如果为了避免更多的在出现错误后进行复杂的回滚操作。先处理危险的操作是一个比较好的选择。

假设服务器的处理逻辑都正确（一般情况还是应该这样假设吧），那么可以任务，交互第一步骤FEDSVRD已经到Mailsvrd A上取过一次邮件，在这个事务的周期（最不及也只有5s时间吧）内，Mailsvrd A停止服务（coredump，断电）的概率不会很高，大致小于0.0001%吧，就算Mailsvrd A在用户读取邮件后停止了服务，会出现问题的用户大致也只有5s以内，为这5s内出错的用户写回滚语句是否值得全看你的个人意志和观点。个人倾向于逃避这个问题，记录日志便于日后回溯也许就足够了（大家也许好奇，为什么我一直主张逃避复杂的回滚操作，请看下一节）。