1. 传输层
在前面计算机网络基础-CSDN博客我们说过TCP/IP五层模型,每一层都在网络通信中发挥不同的作用,前一章我们学过应用层协议,在应用层将数据准备好了之后,并不是直接发送到对端主机的,而是自顶向下贯穿协议栈,这一章我们聊聊应用层到传输层发生了什么,传输层到应用层又发生了什么。
传输层主要负责两台主机之间的数据传输,确保数据能从发送端传输到接收端。
2. 再谈端口号
2.1 端口号的作用
端口号(Port)标识了一个主机上进行通信的不同的应用程序;
例如传输层给收到了收据后,具体要交给应用层的哪个进程。所以发送端的传输层封装报文时,就会添加上将来会发送到对端的哪个进程(端口号)。接收端在传输层提取出端口号,就可以知道具体交给哪个进程了。
2.2 五元组
在TCP/IP协议中, 用 "源IP", "源端口号", "目的IP", "目的端口号", "协议号" 这样一个五元组来标识一个通信。
客户端A和B都访问了服务器,那么A和B的IP地址肯定是不相同的。而客户端又同时打开了服务端的两个Web网站(两个进程),那么这两个进程的端口号肯定也是不相同的。我们使用一个五元组就能标识一次通信。
服务端接受到一个这样的五元组后:
1.提取出目的IP和目的端口,确定这个五元组是发给自己的。
2.提取出协议号对数据提供服务
3.提取出源IP和源端口,将他作为响应数据的目的IP和目的端口,将处理好的数据发送回客户端
五元组在TCP/IP模型的位置:
1. 源IP和目的IP都在网络层,用于指明将数据从当前主机发送到互联网上的哪一台主机上。
2. 源端口和目的端口在传输层,用于将数据交给应用层的哪一个进程。
3. 协议号在网络层,用于让网络层知道应该将数据交给传输层的哪一个协议。
2.3 端口号划分
- 0 - 1023: 知名端口号, HTTP, FTP, SSH等这些广为使用的应用层协议, 他们的端口号都是固定的.
- 1024 - 65535: 操作系统动态分配的端口号. 客户端程序的端口号, 就是由操作系统从这个范围分配的
2.4 常见知名端口
有些服务器是非常常用的, 为了使用方便, 人们约定一些常用的服务器, 都是用以下这些固定的端口号
- ssh服务器, 使用22端口
- ftp服务器, 使用21端口
- telnet服务器, 使用23端口
- http服务器, 使用80端口
- https服务器, 使用443
执行命令vim /etc/services, 可以看到知名端口号
两个问题
1. 一个进程是否可以bind多个端口号?
可以,进程可以通过创建多个套接字,并将它们分别绑定到不同的端口号来实现这一点。每个套接字都可以独立地进行网络通信,而不会相互干扰。以一个简单的Web服务器为例,它可能需要同时监听HTTP(通常为80端口)和HTTPS(通常为443端口)的流量。为了实现这一点,Web服务器进程可以创建两个套接字,一个用于监听80端口,另一个用于监听443端口。这样,当客户端发送HTTP请求时,它会被80端口的套接字接收并处理;当客户端发送HTTPS请求时,它会被443端口的套接字接收并处理。
2. 一个端口号是否可以被多个进程bind?
不行,因为端口号的作用就是标识进程的唯一性,如果两个进程都bind同一个端口号就会出现bind失败的问题。
2.5 netstat
netstat是一个用来查看网络状态的重要工具.
语法:netstat [选项]
功能:查看网络状态常用选项:
- n 拒绝显示别名,能显示数字的全部转化成数字
- l 仅列出有在 Listen (监听) 状态的服务
- p 显示建立相关链接的程序名
- t (tcp)仅显示tcp相关选项
- u (udp)仅显示udp相关选项
- a (all)显示所有选项,默认不显示LISTEN相关
一般查看TCP相关选项时,我们会选择使用nltp。
一般查看UDP相关选项时,我们会选择使用nlup。
2.6 pidof
在查看服务器的进程id时非常方便.
语法:pidof [进程名]
功能:通过进程名, 查看进程id
我们也可以配合xargs命令杀死一个进程。xargs命令的作用是将管道或标准输入(stdin)数据转换成命令行参数。
如果不使用xargs,而直接使用管道将数据(HttpServer的pid)交给kill的话是不行的。因为管道的作用是将左侧的数据以标准输入的形式交给右侧的。而kill命令不支持标准输入传参,只支持命令行传参。
我们加上xargs就可以成功删除了。
3. UDP协议
3.1 UDP协议格式
- 16位源端口号:数据从哪个进程来的。
- 16位目的端口:数据要发给对端哪个进程
- 16位UDP长度:表示整个数据报(UDP首部+UDP数据)的长度。
- 16位UDP校验和:如果UDP报文的检验和出错,就会直接将报文丢弃。
我们在使用网络编程的接口时,端口号的类型都是uint16_t,原因就在这,因为传输层协议的报文格式中的端口号就是16位。
- 报头和有效载荷如何分离
因为UDP的报头是固定大小的8个字节,所以我们收到一个报文的时候,提取前8个字节,剩下的就是有效载荷。
- UDP如何知道将有效载荷交给上层的哪个进程
UDP报头中有16位目的端口的字段,UDP提取出这个字段就可以得知交给哪个进程。
3.2 如何理解协议
协议其实就是结构化的数据
struct udp_hdr
{
uint16_t src_port;// 源端口
uint16_t dsc_port;// 目的端口
uint16_t length;// UDP长度
uint16_t check;// 校验和
};
- UDP报头封装(应用层到传输层)
当应用层将有效载荷交给传输层时,UDP协议会创建一个对象,并填充对象中的字段。然后开辟一个空间用于存放UDP报头和有效载荷。
- UDP解包分用(传输层到应用层)
提取前8个字节中的目的端口,交给对应的进程。
- UDP报文管理
不管是服务端还是客户端,将来都会收到的大量的UDP报文,还没有来得及向上交付,所以操作系统要对UDP报文进行管理。
操作系统定义了一个结构体struct sk_buff,其中包含几个字段
struct sk_buff
{
char* start;
char* data;
sk_buffer* next;
}
在传输层,只需要维护sk_buff即可,如果我们要向下交付,并不是把缓冲区向下交付,而是将sk_buff向下交付,下几层协议要添加报头只需要将start指针向前移动即可。如果要向上交付,直接将start指针向后移动,就完成了解包。
3.3 UDP的特点
UDP传输的过程类似于发快递。
- 无连接: 知道对端的IP和端口号就直接进行传输, 不需要建立连接;
- 不可靠: 没有确认机制, 没有重传机制; 如果因为网络故障该段无法发到对方, UDP协议层也不会给应用层返回任何错误信息;
- 面向数据报: 不能够灵活的控制读写数据的次数和数量
- 面向数据报:
如同发快递,你发十个快递,对方一定能收到十个快递(不考虑丢包),应用层交给UDP多长的报文, UDP原样发送, 既不会拆分, 也不会合并;
用UDP传输100个字节的数据:
如果发送端调用一次sendto, 发送100个字节, 那么接收端也必须调用对应的一次recvfrom, 接收100个字节; 而不能循环调用10次recvfrom, 每次接收10个字节;
3.4 UDP的缓冲区
- UDP没有真正意义上的发送缓冲区,调用sendto会直接交给内核,由内核将数据传给网络层协议进行后续的传输动作。
- UDP具有接收缓冲区,但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺序一致,如果缓冲区满了,再到达的UDP数据就会被丢弃。
UDP的socket既能读,也能写,这个概念叫做全双工
- 如何理解缓冲区
UDP的缓冲区其实就是一个队列,上面我们说过传输层是怎样管理UDP报文的。
我们只需要创建一个头节点即可。
- 为何UDP一定要有接受缓冲区
如果没有接受缓冲区,那么上层收到一个报文后没有及时处理,其他的报文就立刻被丢弃。UDP虽然不保证可靠性,但是这种做法也太不可靠了,这就是浪费主机资源和网络资源的方式。于是UDP要维护一个接受缓冲区。
3.5 关于16位UDP长度
还记得UDP报文中的一个字段:16位UDP长度吗。
我们之前说过,16位UDP长度表示整个数据报(UDP首部+UDP数据)的长度。也就意味着,包括报头在内,UDP一次只能传输最大64KB(2的16次方)的数据。如果数据超过64KB,那么就要在应用层手动分包,多次发送,并在接受端组装。
3.6 基于UDP的应用层协议
- NFS: 网络文件系统
- TFTP: 简单文件传输协议
- DHCP: 动态主机配置协议
- BOOTP: 启动协议(用于无盘设备启动)
- DNS: 域名解析协议