以前在学谢希仁教授主编的《计算机网络》时,一直没弄懂IP首部的校验和是如何计算的。今天在看《TCP/IP详解 卷一》时,看到了一段关于首部校验和的描述。如下:
为了计算一份数据报的IP校验和,首先把检验和的字段设置为0。然后,对首部中每个16bit进行二进制反码求和(整个首部看成是由一串16bit的字组成),结果存在校验和字段中。当收到一份IP数据报后,同样对首部中每16bit进行二进制反码求和。由于接收方在计算过程中包含了发送方存在首部中的检验和,因此,如果首部在传输过程中没有发生任何差错,那么接收方计算的结果应该全为1。如果结果不是全1,即检验和错误。
通过Wireshark抓到一个IP数据包如下,
也就是说IP数据包未发送时的头部为:
head = [0x45c0, 0x0028,
0x4d1c, 0x4000,
0x2c06, 0x0000,
0x3a9a, 0xc703,
0xc0a8, 0x8226]
对应的校验和计算如下(Python脚本):
def checksum(head):
sum = 0
for i in range(0, len(head)):
sum = sum + (0xffff-head[i])
#print "%4X"%sum
sum = (sum>>16)+(sum & 0xffff) # why ?
#print "%4X"%(sum)
return sum
为什么需要sum = (sum>>16)+(sum & 0xffff)这一步?
答:这是二进制反码求和算法决定的。即计算校验和时,若相加后最高位有进位,那么不能舍弃,一定要加到低位,才能是结果正确。
现在,IP数据包的头部为:
head = [0x45c0, 0x0028,
0x4d1c, 0x4000,
0x2c06, 0xBC87,
0x3a9a, 0xc703,
0xc0a8, 0x8226]
再调用checksum方法一次,将得到 全1 的最终结果。