理解TCP和UDP
根据数据传输方式的不同,基于网络协议的套接字一般分为TCP套接字和UDP套接字。因为TCP套接字是面向连接的,因此又称基于流(stream)的套接字。
TCP是Transmission Control Protocol(传输控制协议)的简写,意为“对数据传输过程的控制”。
TCP/IP协议栈
stack层
基于互联网的有效数据传输并非通过1个庞大协议解决问题,而是化整为零,通过层次化方案——TCP/IP协议栈解决。
各层可能通过操作系统实现,也可能通过类似NIC的硬件设备实现。
以多个标准为依据设计的系统称为开放式系统。
链路层
链路层是物理链接领域标准化的结果,也是最基本的领域,专门定义LAN、WAN、MAN等网络标准。
IP层
准备好物理连接后就要传输数据。为了在复杂的网络中传输数据, 首先需要考虑路径的选择。向目标传输数据需要经过哪条路径?解决此问题就是IP层,该层使用的协议就是IP。
IP本身是面向消息的、不可靠的协议。每次传输数据时会帮我们选择路径,但并不一致。IP协议无法应对数据错误。
TCP/UDP层
IP层解决数据传输中的路径选择问题。只需照此路径传输数据即可。TCP和UDP层以IP层提供的路径信息为基础完成实际的数据传输,故该层又称传输层(Transport)。UDP比TCP简单。
TCP和UDP存在于IP层之上,决定主机之间的数据传输方式,TCP协议确认后向不可靠的IP协议赋予可靠性。
应用层
上述内容是套接字通信过程中自动处理的。选择数据传输路径、数据确认过程都被隐藏到套接字内部。
编写软件过程中,需要根据程序特点决定服务器端和客户端之间的数据传输规则(规定),这便是应用层协议。
网络编程的大部分内容就是设计并实现应用层协议。
实现基于TCP的服务器端/客户端
TCP服务器端的默认函数调用顺序
给出TCP服务器端默认的函数调用顺序,绝大部分TCP服务器端都按照该顺序调用。
1. socket() 创建套接字
2. bind() 分配套接字地址
3. listen() 等待连接请求状态
4. accept() 允许连接
5. read()/write()数据交换
6. close() 断开连接
前面讲的是调用socket函数创建套接字,声明并初始化信息结构体变量,调用bind函数向套接字分配地址。
进入等待连接请求状态
只有调用了listen函数(进入等待连接请求状态),客户端才能进入可发出链接请求的状态,也就是说才能调用connect函数(若提前调用将发生错误)。
#include <sys/socket.h>
int listen(int sock,int backlog);
sock:希望进入等待连接请求状态的套接字文件描述符,传递的描述符套接字参数成为服务器端套接字(监听套接字)
backlog:连接请求等待队列的长度,若为5,表示最多使5个连接请求进入队列。
“服务器端处于等待连接请求状态”是指,客户端请求连接时,受理连接前一直使请求处于等待状态。
listen函数的第二个参数值与服务器端的特性有关,像频繁接受请求的Web服务端至少应为15。另外,连接请求队列的大小始终根据实验结果而定。
受理客户端连接请求
#include<sys/socket.h>
int accept<int sock, struct sockaddr * addr, socklen_t * addrlen);
sock:服务器套接字的文件描述符
addr:保存发起连接请求的客户端地址信息的变量地址值,调用函数后向传递来的地址变量参数填充客户端地址信息。
addrlen:第二个参数addr结构体的长度,但是存有长度的变量地址。函数调用完成后,该变量即被填入客户端地址长度。
accept函数受理连接请求等待队列中待处理的客户端连接请求。函数调用成功时,accept函数内部将产生用于数据I/O的套接字,并返回其文件描述符。需要强调的是,套接字是自动创建的,并自动与发起连接请求的客户端建立连接。
TCP客户端的默认函数调用顺序
- socket() 创建套接字
- connect() 请求连接
- read()/write() 数据交换
- close() 断开连接
与服务器端相比,区别就在于“请求连接”,它是创建客户端套接字后向服务器端发起的连接请求。
#include <sys/socket.h>
int connect(int sock, struct sockaddr * servaddr, socklen_t addrlen);
sock:客户端套接字文件描述符
servaddr:保存目标服务器端地址信息的变量地址值
addrlen:以字节为单位传递已传递给第二个结构体参数servaddr的地址变量长度
客户端调用connect函数后,发生下列情况之一才会返回(完成函数调用):
1. 服务器端接受连接请求
2. 发生断网等异常情况而中断连接请求
需要注意,所谓的“接收连接”并不意味着服务器端调用accept函数,其实是服务器端把连接请求信息记录到等待队列。因此connect函数返回后并不立即进行数据交换。
客户端的IP地址和端口在调用connect函数时自动分配(IP地址是主机IP,端口随机),无需调用标记的bind函数进行分配。
基于TCP的服务器端/客户端函数调用关系
上面讲解了TCP服务器端/客户端函数的调用关系,实际上两者并非相互独立。
实现迭代服务器端/客户端
编写回声(echo)服务器端/客户端。顾名思义,服务器端将客户端传输的字符串数据原封不动地传回客户端,就像回声一样。
实现迭代服务器端
之