校验和的计算方法

校验和算法

   


unsigned short check_sum(unsigned short *addr,int len)
{
  register int nleft=len;
  register int sum=0;
  register short *w=addr;
  short answer=0;

  while(nleft>1)
  {
    sum+=*w++;
    nleft-=2;
  }
  if(nleft==1)
  {
    *(unsigned char *)(&answer)=*(unsigned char *)w;
    sum+=answer;
  }

  sum=(sum>>16)+(sum&0xffff);
  sum+=(sum>>16);
  answer=~sum;
  return(answer);
}





    首先,IP、ICMP、UDP和TCP报文头都有检验和字段,大小都是16bit,算法基本上也是一样的。

    在发送数据时,为了计算数据包的检验和。应该按如下步骤:

    1、把校验和字段设置为0;

    2、把需要校验的数据看成以16位为单位的数子组成,依次进行二进制反码求和;

    3、把得到的结果存入校验和字段中

    在接收数据时,计算数据包的检验和相对简单,按如下步骤:

    1、把首部看成以16位为单位的数字组成,依次进行二进制反码求和,包括校验和字段;

    2、检查计算出的校验和的结果是否为0;

    3、如果等于0,说明被整除,校验和正确。否则,校验和就是错误的,协议栈要抛弃这个数据包。

 

    虽然说上面四种报文的校验和算法一样,但是在作用范围存在不同:IP校验和只校验20字节的IP报头;而ICMP校验和覆盖整个报文(ICMP报头+ICMP数据);UDP和TCP校验和不仅覆盖整个报文,而且还有12个字节的IP伪首部,包括源IP地址(4字节)、目的IP地址(4字节)、协议(2字节)、TCP/UDP包长(2字节)。另外UDP、TCP数据报的长度可以为奇数字节,所以在计算校验和时需要在最后增加填充字节0(填充字节只是为了计算校验和,可以不被传送)。

    在UDO传输协议中,校验和是可选的,当校验和字段为0时,表明该UDP报文未使用校验和,接收方就不需要校验和检查了!那如果UDP校验和的计算结果是0时怎么办?书上有一句话:“如果校验和的计算结果为0,则存入的值为全1(65535),这在二进制反码计算中是等效的”

 

那么校验和到底怎么计算了?

1、什么是二进制反码求和

    对一个无符号的数,先求其反码,然后从低位到高位,按位相加,有益处则向高位进1(和一般的二进制法则一样),若最高位有进位,则向最低位进1.

    首先这里的反反码好像和以前学的有符号反码不一样,这里不分正负数,直接每个为都取反。

    上面加粗的那句话和我们平时的加法法则不一样,最高位有进位,则向最低位进1。确实有些疑惑,为什么要这样呢?自习分析一下,上面的这种操作,使得在发送加法进位溢出时,溢出值并不是10000,而是1111.也即是当相加结果满1111时溢出,这样也可以说明为什么0000和1111都表示0了。

    下面是两种二进制反码求和的运算:

    原码加法运算:3(0011)+5(0101)=8(1000)

                  8(1000)+9(1001)=1(0001)

    反码加法运算:3(1100)+5(1010)=8(0111)

                  8(0111)+9(0110)=2(1101)

    从上面的例子中,当加法未发生溢出时,原码与反码加法运算结果一样;当有溢出时,结果就不一样了,原码是满10000溢出,而反码是满1111溢出,所以相差正好是1.

    另外,关于二进制反码求和运算需要说明的一点是,先取反后相加与先相加后取反,得到的结果是一样的。

2、校验和算法实现

    代码如下:

    USHORT checksum (USHORT *buffer,int size)

    {

        Unsigned long cksum=0;

        While (size>1)

        {

            Cksum +=*buffer++;

            size -=sizeof(USHORT);

        }

        If (size)

        {

            Cksum +=*(UCHAR *) buffer;

        }

        //将32位转换为16位

        While (cksum>>16)

            Cksum = (cksum>>16) + (cksum & 0xffff);

        Return (USHORT) (~cksum);

    }

    buffer是指向需要校验数据缓冲区的指针,size是需要检验数据的总长度(字节为单位)。

    4-13行代码是对数据按16bit累加求和,由于最高位的进位需要加在最低位上,所以cksum必须是32位的unsigned long型,高16bit用于保存累加过程中的进位;另外代码10~13行是对size为奇数情况的处理。

    14~16行代码的作用是将cksum高16bit的值加到低16bit上,即把累加中最高位的进位加到最低位上。这里使用了while循环,判断cksum高16bit是否非零,因为第16行代码执行的时候,还是可能向cksum的高16bit进位。

    有些地方是通过下面两条代码实现的:

    Cksum = (cksum >> 16) + (cksum & 0xffff);

    Cksum = (cksum >> 16);

    这里只进行了两次相加,即可保证相加后cksum的高16位为0,两种方式的效果是一样,事实上,上面的循环也最多执行两次!

    17行代码即对16bit数据累加的结果取反,得到二进制反码求和的结果,然后函数返回该值。

    3、为什么使用二进制反码求和呢?

    为什么要使用二进制反码来计算校验和呢,而不是直接使用原码或者是补码呢?

    在谷歌上找到一篇相关的文章:

   

    上面是原文的一部分,说明在TCP/IP校验和中使用反码求和的一些优点:

a、 不依赖系统是大端小端。即无论你是发送方计算机或者接收方检查校验和时,都不要调用htons或者ntohs,直接通过上面的算法就可以得到正确的结果。这个问题你可以自己举个例子,用反码求和时,交换16位数的字节顺序,得到的结果相同,只是字节顺序相应地也交换了;而如果使用原码或者补码求和,得到的结果可能就不同。

b、 计算和验证校验和比较简单、快递。





实例:

IP头:  

             45 00    0031

             89 F5    0000

             6E 06    0000(校验字段)

             DE B7   455D      ->   222.183.69.93

             C0 A8   00DC    ->   192.168.0.220

计算:   

    4500+ 0031 +89F5 + 0000 + 6e06+ 0000 + DEB7 + 455D + C0A8 + 00DC =322C4

    0003+ 22C4 = 22C7

    ~22C7 =DD38     ->即为应填充的校验和

当接受到IP数据包时,要检查IP头是否正确,则对IP头进行检验,方法同上:

计算:

    4500 + 0031+89F5 + 0000 + 6E06+ DD38 + DEB7 + 455D + C0A8 + 00DC =3 FFFC

    0003 + FFFC= FFFF

    ~FFFF =00000    ->正确

TCP首部检验和与IP首部校验和的计算方法相同,在程序中使用同一个函数来计算。
展开阅读全文

没有更多推荐了,返回首页