tcp校验思想

tcp数据校验的意义

问题

TCP如何保证数据的正确性,保证数据内容不会出错。大部分人就会开始说丢包重传、接收确认之类的东西,但这些都扯偏了,只要少数人能够正确回答题目要问的问题:首部校验
对于能答上这个问题的人,我会进一步问,这个校验机制能够确保数据传输不会出错吗?
答案是不能,但是至今为止我没有遇到任何一个面试者能够正确回答这个问题。

原因

TCP协议中规定,TCP的首部字段中有一个字段是校验和,发送方将伪首部、TCP首部、TCP数据使用累加和校验的方式计算出一个数字,然后存放在首部的校验和字段里,接收者收到TCP包后重复这个过程,然后将计算出的校验和和接收到的首部中的校验和比较,如果不一致则说明数据在传输过程中出错。这就是TCP的数据校验机制
但是这个机制能够保证检查出一切错误吗?显然不能。因为这种校验方式是累加和,也就是将一系列的数字(TCP协议规定的是数据中的每16个比特位数据作为一个数字)求和后取末位。
但是小学生都知道A+B=B+A,假如在传输的过程中有前后两个16比特位的数据前后颠倒了(至于为什么这么巧合?我不知道,也许路由器有bug?也许是宇宙中的高能粒子击中了电缆?反正这个事情的概率不为零,就有可能会发生),那么校验和的计算结果和颠倒之前是一样的,那么接收端肯定无法检查出这是错误的数据。
至于应用层收到这个数据后会怎么样,不清楚,只能看运气,立刻崩溃那是比较好的结果了。
这篇文章是亚马逊的一次故障记录,这个故障中就是遇到了这个问题,损失很严重。

解决方案

既然TCP自带的校验算法并不靠谱,我们就需要在应用层自己建立一套新的数据校验机制。

MD5

最简单的就是使用MD5校验,在发送数据前将数据使用MD5加密,并将MD5摘要一起发送,接收端接收数据后将数据再次用MD5加密,如果得到的摘要和收到的摘要一致说明数据正确。
上文亚马逊的处理方式就是这样。

是否绝对安全

同时使用TCP的加和校验和MD5加密,双管齐下,由于他们的加密原理大相庭径,所以基本不可能出现某种传输错误但是依然能通过双重校验。当然了这种情况出现的可能性到底是不是0需要严格的数学证明,但是我水平有限所以无法给出。但是你依然可以显然的看出这种情况出现的概率比单一一种校验机制被巧合的错误通过的概率要小很多个数量级。

当然另一种校验方式除了MD5校验,还可以使用其他的加密校验算法加密。

是否要处理校验漏洞

TCP数据的校验漏洞是个很冷门的知识,可能只有刨根问底的人才会对此有过思考,因为普通的人遇到它的概率实在小得可怜,只有那种到了很大处理规模的服务器上才可能见到一次,所以通常的网络开发中不处理这个问题也没有什么。
什么时候应该考虑处理这种情况也并没有什么标准,我认为当你的服务器出现校验漏洞会造成很大的损失的时候你就必须要处理它了,像上文亚马逊的那次故障损失惨重,如果你的服务器不会有什么严重损失,就让他宕机一次也无所谓。

总结

TCP数据的校验的知识并不是网络开发中的关键点,但是通过这个问题可以看出一个人对TCP协议的了解以及思考。所以写这边文章希望能够让面试者对TCP协议有更多深入的了解与思考,取得更好的面试结果。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值