💐个人主页:初晴~
📚相关专栏:计算机网络那些事
一、UDP报文格式
可以看出UDP报文主要由报头和正文两部分构成,报头存储了此次报文的一些重要信息,而正文才是真正需要传输的内容。本篇文章就主要来介绍一下UDP报头的组成与作用了。
二、UDP报头的结构与作用
我们可以看到报头又被分为了源端口、目的端口、长度、校验和四个部分,每个部分各占 16 个比特也就是 2 个字节,故UDP报头的总长度就为固定的 8 个字节。
注意:
UDP报头的各字段的长度与作用是规定好的,我们作为普通程序员是没有权限修改的,换句话说,我们就算单方面修改了协议,由于其他人遵守的是官方协议,将会导致我们写的报文无法被其它人正确解读。因此,为了能正常地传输与解读数据,这里的这些协议细节我们一定要严格遵守
接下来我们就来深入解读一下这几个字段的作用与注意事项吧:
(1)源端口与目的端口
在网络通讯中,涉及到四个关键信息:
源IP、目的IP
源端口、目的端口
类比于寄快递时,一个快递单上也至少需要四个关键信息:
发件人地址、收件人地址
发件人电话、收件人电话
简单来说,这几个参数就像是网络通信中的“快递单”,起到了一个定位的作用,在庞大的互联网中确定了此次通信中的起始地与目的地
在同一时刻,一个主机中的某一端口号只会映射一个进程,因此就可以通过端口号定位到对应的服务端/客户端的进程了。
值得注意的是一个端口号的长度为16比特(bit),也就是2个字节(byte),因此报头中的 源端口 与 目的端口 直接记录对应的端口号即可,不需要做过多的处理
(2)报文长度
报文长度=报头长度+载荷(正文)长度
它就是用来记录此次报文的总长度,让程序根据长度来对报文进行划分,进而能够正确地进行解读。
不过,值得注意的是,这里存储报文长度的空间只有2个字节,什么概念呢?就是代表整个报文的长度最多也只有64KB
这主要还是历史遗留性问题。UDP协议是在30多年前提出的,在当时,64KB已经是一个非常大的数据量了。不过那时候的开发者肯定想象不到在短短30年后的今天,随便拍张照片都是MB级别的了,64KB就完全不够看得了。
但如果我们就是要传输一个很大的数据该怎么办呢?
有两种方案:
<1>方案一
将一个大的数据包拆分成多个小的,再分别进行传输,接收方再通过组包最终获取到数据
但这个方案实施起来将会非常复杂。首先,数据的拆分与组合本身就十分复杂,再加上网络传输过程中充满了不确定性,数据包到达的先后顺序,甚至数据包是否能到达(丢包问题)都是无法确定的,这会导致接收方的组包操作将会变的异常复杂,就算真的可以处理,消耗的时间也是非常长的,这对于“时间就是金钱”的网络传输是十分致命的。
因此,我们一般不会采用这个方案
<2>方案二
选用别的适合传输大数据量的协议,比如大名鼎鼎的TCP协议
TCP协议对于长度没有任何限制,并且还带有可靠传输等机制,保障了传输的稳定性,通信质量也比较高。
小结
UDP报文的可传输的最大数据量比较小,实在要传输大量的数据时还是采用TCP协议比较合适
(3)校验和
因为网络传输主要是通过 电信号/光信号/电磁波 来传播的,而这些信号很容易会受到外界环境的干扰,导致传输的数据发生改变,使最终结果出现错误。
举个例子:我要去超市买苹果、土豆、鸡蛋、番茄 4 样物品,这时,就用 4 来当做“校验和”,购物结束后,数一下实际购物数,与校验和进行比较,若相等,则任务此次购物时正确的,否则则认为此次购物出现错误
不过这里主要就是为了让大家知道什么是校验和。事实上这种算法比较草率,没法确定购买物品的准确性当我购买的其它物品种类为 4 时,仍然会认为这次购买是正确的。为了更准确的判断,就需要更加严谨的 检查策略和算法
下图就为UDP数据校验的检查过程:
上述这种校验方法被称之为CRC检验方法。通过对前后两次数据分别计算校验和,接着通过比较校验和来判断两次数据是否一致,如果不相同,则会直接对数据进行丢弃。
由于这种机制,发送方无法得知接收方是否成功接收数据,也就无法进行数据重发等补救机制,这会导致接收方可能会出现数据丢失,数据接收不完整,从而导致最终数据解析出现问题。因此,我们一般认为 UDP 是一种不可靠传输
- 有人可能会问,记录校验和的空间只有 2 个字节,万一校验和太长了怎么办?
- 事实上不必担心这一问题,就算校验和过大,发生溢出,也不会影响“相等性判断”,我们只需要判断两次校验和是否相等即可,相等的值溢出后仍会保持相等,因此这并不会影响我们的判断。我们也并不关注校验和的具体指是多少。
那么,在计算校验和的过程中,是否可能会出现两个不同的数据,生成的校验和相同呢?
这的确可能发生,不过概率是非常低的。不过对于CRC算法来说,这个概率相对还比较高
除了CRC算法,还可能会用到其它一些算法来计算校验和,比如两个经典算法 MD5 与 SHA1
<1>MD5
MD5算法, 本质上可以理解为 字符串Hash算法
背后的实现过程是一个 “数学过程”
, 可以理解为 套公式
不过具体的计算细节就不是我们需要关注的了,我们更需要关心它的特点:
1、定长: 无论输入的字符串 长度是多少 , 得到的 MD5
都是固定长度 的
2、分散性: 对于不同的字符串, 即使字符串中只改变了一点点, 得到的 MD5
差异都是很大的
我们知道,数据越分散,越有利于建哈希表,越不容易发生哈希冲突。因此,MD5 算法适合用来做哈希算法
3、不可逆性: 根据输入内容计算 MD5值 是非常容易的,但已知 MD5 值想还原出原始内容就几乎无法实现了
因此MD5 算法适合做加密算法
<2>SHA1
SHA1算法与MD5是十分类似的,也具有以上三个特点,博主这里就不做过多赘述了
总结
UDP报头结构
- 源端口(Source Port):16位,标识发送方的应用程序端口号。
- 目的端口(Destination Port):16位,标识接收方的应用程序端口号。
- 长度(Length):16位,表示整个UDP数据报的长度,包括头部和数据部分。
- 校验和(Checksum):16位,用于检测数据报在传输过程中是否发生了损坏。此字段在某些情况下(如IPv4中)可能是可选的。
UDP报文的使用场景
- 实时多媒体传输:由于UDP无需建立连接,发送速度快,适用于语音、视频等实时传输。
- 广播或多播通信:UDP支持向多个接收者同时发送数据,适用于广播或多播应用。
- 简单服务查询:如DNS查询等,要求快速响应,但对数据准确性要求不高。
- 游戏:在线游戏中,为了保证玩家体验,通常使用UDP进行实时数据传输。
那么本篇文章就到此为止了,如果觉得这篇文章对你有帮助的话,可以点一下关注和点赞来支持作者哦。如果有什么讲的不对的地方欢迎在评论区指出,希望能够和你们一起进步✊