与socket网络编程有关的函数

本文链接：https://blog.csdn.net/oqqHuTu12345678/article/details/125728148

以下内容源于网络资源的学习与整理，如有侵权请告知删除。

下面这些函数所涉及的头文件以及更多细节，可以利用man手册查阅，比如“man 3 recv”可以查阅recv函数（1shell，2api，3库）。

一、与服务器端有关的函数

服务器端涉及以下函数：

（1）socket函数：创建一个网络套接字，获取网络连接的文件描述符。

（2）bind函数：将服务器的端口、IP地址与socket函数创建的文件描述符绑定。

（3）listen函数：监听服务器的当前端口（其他端口不监听）。

（4）accept函数，阻塞以等待用户连接。

1.1 socket函数

函数原型

int socket(int af, int type, int protocol);
         //IP地址  //套接字类型  //传输协议

函数作用

此函数用来创建一个网络套接字，并确定套接字的各种属性。该函数返回一个socket的文件描述符，是int类型的整数。

参数说明

（1）af，表示IP地址类型。可取值为 AF_INET（表示IPv4 地址）、AF_INET6（表示IPv6 地址）。

（2）type，表示数据传输方式（或者说套接字类型）。可取值为 SOCK_STREAM（表示流格式套接字、面向连接的套接字）、SOCK_DGRAM（表示数据报套接字、无连接的套接字）。

（3）protocol，表示传输协议，常用选项包括 IPPROTO_TCP（表示TCP 传输协议）、IPPTOTO_UDP（表示UDP传输协议）。

补充说明

（1）socket函数在<sys/socket.h> 头文件中，调用该函数时要包含该文件。

（2）为什么需要指定protocol这个参数？

一般情况下，我们指定 af 和 type 参数就可以创建套接字了，操作系统会自动推演出协议类型（此时protocol参数的值可以设置为0），除非有两种不同的协议支持同一种地址类型和数据传输类型，此时操作系统没办法自动推演，需要指定protocol这个参数。

比如使用IPv4地址而且使用 SOCK_STREAM 传输数据的协议只有 TCP，那么操作系统会自动推导出协议类型为TCP，那么调用socket函数的方式有两种：将protocol的值设为0，或者显式地设为 IPPROTO_TCP，如下所示：

int tcp_socket = socket(AF_INET, SOCK_STREAM, 0);
//或者
int tcp_socket = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);

1.2 bind函数

函数原型

int bind(int sock, struct sockaddr *addr, socklen_t addrlen);  
                   //服务器端的IP和端口信息

函数作用

此函数将（服务器端的）套接字与（服务器端的）特定的IP地址、端口绑定起来。

绑定之后，流经该IP地址、端口的数据才能交给这个套接字处理。

参数说明

（1）sock，表示（服务器端）使用socket函数创建套接字时，所返回的文件描述符。

（2）addr，表示指向（struct sockaddr 这个结构体类型所定义的、表示服务器端的）变量的指针。

（3）addrlen，表示struct sockaddr 结构体类型所定义的变量的大小，可由 sizeof() 计算得出。

代码分析

下面代码的作用，是将创建的套接字与IP地址 127.0.0.1、端口 1234 绑定。

//创建套接字
int serv_sock = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);

//创建sockaddr_in结构体变量
struct sockaddr_in serv_addr;
memset(&serv_addr, 0, sizeof(serv_addr)); //每个字节都用0填充
serv_addr.sin_family = AF_INET; //使用IPv4地址
serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); //具体的IP地址
serv_addr.sin_port = htons(1234); //端口

//将套接字和IP、端口绑定
bind(serv_sock, (struct sockaddr*)&serv_addr, sizeof(serv_addr));
                //这里进行数据类型强制转化

（1） struct sockaddr_in 结构体

我们来看一下struct sockaddr_in 结构体的定义：

struct sockaddr_in{
    sa_family_t sin_family; //地址族（Address Family），也就是地址类型
    uint16_t sin_port; //16位的端口号
    struct in_addr sin_addr; //32位IP地址
    char sin_zero[8]; //不使用，一般用0填充
};

sin_family 和 socket 函数的第一个参数的含义相同，取值也保持一致（不过它是unsigned short类型的，占两个字节，而socket 函数的第一个参数是int类型的，占4个字节）。
sin_prot 为端口号。uint16_t 的长度为两个字节，理论上端口号的取值范围为 0~65536，但是 0~1023 的端口一般由系统分配给特定的服务程序，例如 Web 服务的端口号为 80，FTP 服务的端口号为 21，所以我们的程序要尽量在 1024~65536 之间分配端口号。
sin_addr 是 struct in_addr 结构体类型的变量。
sin_zero[8] 是多余的8个字节，没有用，一般使用 memset() 函数填充为 0。

这里的 struct in_addr 结构体只包含一个成员，如下所示：

struct in_addr{
    in_addr_t s_addr; //32位的IP地址
};

in_addr_t 在头文件 <netinet/in.h> 中定义，它等价于 unsigned long，长度为4个字节。这说明 s_addr 是一个整数，而代码中定义的IP地址是字符串“127.0.0.1”，所以上面代码中使用 inet_addr() 函数进行转换。转后serv_addr.sin_addr.s_addr =16777343。

为什么要搞这么复杂，struct sockaddr_in结构体中嵌套struct in_addr结构体，而不用 sockaddr_in 的一个成员变量来直接指明IP地址呢？另外，socket() 函数的第一个参数已经指明了地址类型，为什么在 sockaddr_in 结构体中还要再说明一次呢？这些繁琐的细节确实给初学者带来了一定的障碍，我想，这或许是历史原因吧，后面的接口总要兼容前面的代码。

（2）struct sockaddr 结构体

上述代码先创建 struct sockaddr_in 类型变量，然后在bind()函数中强制转换为 struct sockaddr 类型。为何不直接创建 struct sockaddr 类型变量呢？毕竟bind()函数第二个参数类型就是 struct sockaddr 类型的。

我们看一下struct sockaddr 结构体的定义：

struct sockaddr{
    sa_family_t sin_family; //地址族（Address Family），也就是地址类型
    char sa_data[14]; //IP地址和端口号
};

下图是 struct sockaddr 与 struct sockaddr_in 的对比（括号中的数字表示所占用的字节数）：

可见struct sockaddr 和 struct sockaddr_in 的长度相同，都是16字节，只是将IP地址和端口号合并到一起，用一个成员 sa_data 表示。要想给 sa_data 赋值，必须同时指明IP地址和端口号，例如”127.0.0.1:80“。遗憾的是，没有相关函数将这个字符串转换成需要的形式，也就很难给 sockaddr 类型的变量赋值，所以使用 sockaddr_in 来代替。这两个结构体的长度相同，强制转换类型时不会丢失字节，也没有多余的字节。

可以认为，struct sockaddr 是一种通用的结构体，可以用来保存多种类型的IP地址和端口号，但由于它使用不便，才针对不同的地址类型定义了不同的结构体，然后在使用的时候再强制类型转换。比如 struct sockaddr_in 是专门用来保存 IPv4 地址的结构体；而struct sockaddr_in6是专门用来保存 IPv6 地址的结构体，它的定义如下：

struct sockaddr_in6 {
    sa_family_t sin6_family; //(2)地址类型，取值为AF_INET6
    in_port_t sin6_port; //(2)16位端口号
    uint32_t sin6_flowinfo; //(4)IPv6流信息
    struct in6_addr sin6_addr; //(4)具体的IPv6地址
    uint32_t sin6_scope_id; //(4)接口范围ID
};

1.3 listen函数

函数原型

int listen(int sock, int backlog);

函数作用

该函数可以让（服务器端的）套接字进入被动监听状态。

参数说明

（1）sock，表示（服务器端的）需要进入监听状态的套接字的文件描述符。

（2）backlog，表示请求队列的最大长度。

补充说明

（1）被动监听

指当没有客户端请求时，套接字处于“睡眠”状态，只有当接收到客户端请求时，套接字才会被“唤醒”来响应请求。

（2）请求队列

当套接字正在处理客户端请求时，如果有新的请求进来，套接字是没法处理的，只能把它放进缓冲区，待当前请求处理完毕后，再从缓冲区中读取出来处理。如果不断有新的请求进来，它们就按照先后顺序在缓冲区中排队，直到缓冲区满。这个缓冲区，就称为请求队列（Request Queue）。

缓冲区的长度（能存放多少个客户端请求）可以通过 listen() 函数的 backlog 参数指定，但究竟为多少并没有什么标准，可以根据你的需求来定，并发量小的话可以是10或者20。

如果将 backlog 的值设置为 SOMAXCONN，就由系统来决定请求队列长度，这个值一般比较大，可能是几百，或者更多。

当请求队列满时，就不再接收新的请求。对于 Linux，客户端会收到 ECONNREFUSED 错误，对于 Windows，客户端会收到 WSAECONNREFUSED 错误。

（3）listen函数只是让套接字处于监听状态，并没有接收请求，接收请求需要使用 accept 函数。

1.4 accept函数

函数原型

int accept(int sock, struct sockaddr *addr, socklen_t *addrlen);
//参数1：服务器端创建的套接字文件描述符          
//参数2：保存了客户端的IP和端口号信息

函数作用

当（服务器端的）套接字处于监听状态时，可以通过accept函数来接收客户端请求。

如果该函数返回一个新的套接字的文件描述符，则表示服务器和客户端成功建立一个TCP连接。

参数说明

（1）sock，表示（服务器端）创建的套接字的文件描述符。

（2）addr，表示指向（struct sockaddr_in这个结构体变量所定义的、表示客户端的）变量的指针。

（3）addrlen，表示addr这个指针指向的变量所占空间大小，可由 sizeof() 求得。

补充说明

（1）该函数的第一个参数 sock 是服务器端创建的套接字的文件描述符（我们把它叫做监听fd），而该函数的返回值是一个新的套接字的文件描述符（我们把它叫做连接fd）。编写代码的时候要特别注意：服务器端和客户端通信时，服务器端要使用连接fd，不再使用监听fd。

（2）addr保存了客户端（注意不是服务器端）的IP地址和端口号。

（3）listen函数只是让套接字进入监听状态，并没有真正接收客户端请求，listen函数后面的代码会继续执行，直到遇到 accept函数。accept函数会阻塞程序执行（后面代码不能被执行），以等待客户端的连接。

二、与客户端有关的函数

客户端涉及以下函数：

（1）socket函数：获取网络连接的文件描述符。

（2）connect函数：连接服务器。

连接上之后：

（3）send函数：客服端给服务器发送数据。

（4）recv函数：客服端接收服务器的回复。

2.1 socket函数

同1.1。

2.2 connect函数

函数原型

#include <sys/socket.h>
int connect(int socket, const struct sockaddr *address, socklen_t address_len);

函数作用

该函数在客户端和服务器端之间建立连接。

参数说明

（1）socket，表示（客户端）使用socket函数创建套接字时，所返回的文件描述符。

（2）address，表示指向（struct sockaddr_in这个结构体变量所定义的、表示服务器端的）变量的指针。

（3）address_len，表示address这个指针所指向的变量所占空间大小，可由 sizeof() 求得。

三、常见通用的函数

Linux平台和Windows平台，对于socket，使用不同的发送函数、接收函数。Linux不区分套接字文件和普通文件，统一使用write、read函数，比如使用 write 向套接字中写入数据，使用 read 从套接字中读取数据。Windows区分普通文件和套接字，并定义了专门的接收和发送的函数，即send函数和recv函数。

学习下面内容前，先建立这样的认识：对于socket机制，它内部设置有接收缓冲区和发送缓冲区。利用 write 或者 send 函数，可以把我们想要发送给对方的内容（这些内容目前放在我们自己设置的缓冲区里，而且这个缓冲区与socket自带的接收/发送缓冲区，是不同的缓冲区），拷贝到socket的发送缓冲区中，然后它会自动完成发送；同样地，利用 read 或者 recv 函数，可以将对方发送给我们的数据，从socket的接收缓冲区中，拷贝到我们自己设置的缓冲区里）。

3.1 write函数

函数原型

#include <unistd.h>
ssize_t write(int fildes, const void *buf, size_t nbyte);

函数作用

该函数将缓冲区buf中的nbytes个字节，写入文件描述符fildes对应的文件中，成功则返回写入的字节数，失败则返回 -1。

参数说明

（1）fildes，表示要将数据写入哪个文件中（该文件所对应的文件描述符）。比如服务器要向客户端发送数据，则这里的fildes一般是accept函数返回的连接fd。

（2）buf，表示待写入的数据目前存放在哪个地址。

（3）nbytes，表示要写入多少字节的数据。

3.2 read函数

函数原型

ssize_t read(int fd, void *buf, size_t nbytes);

函数作用

从文件描述符fd对应的文件中读取 nbytes 个字节，并保存到缓冲区 buf。

该函数读取成功，则返回读取到的字节数（但遇到文件结尾则返回0），读取失败则返回 -1。

参数说明

（1）fd，表示要读取的文件对应的文件描述符。客户端想要接收服务器发给它的数据时，则这里一般是客户端自身使用socket函数所获取的套接字文件描述符。

（2）buf，表示要将数据读到哪个地方。

（3）nbytes，表示要读取多少字节的数据。size_t 是通过 typedef 声明的 unsigned int 类型。

3.3 send函数

函数模型

#include <sys/socket.h>
ssize_t send(int socket, const void *buffer, size_t length, int flags);

函数作用

该函数用来将信息发送到一个套接字中，即把缓冲区 buffer 中的 length 个字节写入文件描述符socket对应的文件中。

（1）ssize_t类型，相当于long。

（2）socket，表示要发送数据的套接字的文件描述符。比如服务器要向客户端发送数据，则这里的socket一般是accept函数返回的连接fd。

（3）buffer，表示要发送的消息（或者说要发送的数据目前存放在哪里）。

（4）length，表示要发送多少字节的数据。

（5）flags，该参数一般设置为 0 或 NULL，初学者不必深究。

补充说明

（1）send函数只能在套接字处于连接状态的时候才能使用，因为只有这样才知道接收者是谁。

（2）send函数与 write函数的唯一区别，在于send函数的最后一个参数。当设置flags为0时，send和wirte是同等的。

（3）当消息不适合套接字的发送缓冲区时，send通常会阻塞，除非事先将套接字设置为非阻塞的模式（那样就不会阻塞，而是返回EAGAIN或者EWOULDBLOCK错误，此时可以调用select函数来监视何时可以发送数据）。

3.4 recv函数

函数模型

#include <sys/socket.h>
ssize_t recv(int socket, void *buffer, size_t length, int flags);

函数作用

该用于从一个已连接的socket中接收信息，也就是从socket文件中拷贝信息到缓冲区buffer中，拷贝的长度是length。

参数说明

（1）socket，表示已连接套接字的文件描述符。客户端想要接收服务器发给它的数据时，则这里一般是客户端自身使用socket函数所获取的套接字文件描述符。

（2）buffer，表示把接收到的数据存放在哪里。

（3）length，表示要接收多少字节的数据。

（4）flags，表示标志位，它会影响函数的行为，比如控制是否阻塞函数等等。

3.5 htons函数

函数模型

uint16_t htons(uint16_t hostshort)

函数作用

该函数用来将当前主机字节序转换为网络字节序（即转换成大端模式）。

代码示例

//创建sockaddr_in结构体变量
struct sockaddr_in serv_addr;
memset(&serv_addr, 0, sizeof(serv_addr));  //每个字节都用0填充
serv_addr.sin_family = AF_INET;  //使用IPv4地址
serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1");  //具体的IP地址
serv_addr.sin_port = htons(1234);  //端口号

补充说明

（1）网络字节序是大端模式，而x86架构的cpu一般是小端模式，所以需要进行转换。

（2）htons这字母组合中，h 代表主机字节序，n 代表网络字节序，s代表short，可以理解为“将 short 型数据从当前主机字节序转换为网络字节序”。

（3）通常，以s为后缀的函数中，s代表 2 个字节 short，因此用于端口号转换；以l为后缀的函数中，l代表 4 个字节的 long，因此用于 IP 地址转换。常见的网络字节转换函数如下。

htons()：host to network short，将 short 类型数据从主机字节序转换为网络字节序。
ntohs()：network to host short，将 short 类型数据从网络字节序转换为主机字节序。
htonl()：host to network long，将 long 类型数据从主机字节序转换为网络字节序。
ntohl()：network to host long，将 long 类型数据从网络字节序转换为主机字节序。

3.6 inet_addr函数

函数原型

unsigned long inet_addr( const char *cp )

函数作用

该函数将字符串形式（即点分十进制形式）的IPv4地址（不能处理IPv6地址）转换成32位的长整型，同时还进行网络字节序转换。

代码示例

//创建sockaddr_in结构体变量
struct sockaddr_in serv_addr;
memset(&serv_addr, 0, sizeof(serv_addr));  //每个字节都用0填充
serv_addr.sin_family = AF_INET;  //使用IPv4地址
serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1");  //具体的IP地址
serv_addr.sin_port = htons(1234);  //端口号

#include<netinet/in.h>
#include<arpa/inet.h>
#define IPADDR "192.168.1.102"

int main(void)
{
	int_addr_t addr = 0; //int_addr_t 是 unsigned long
	addr = inet_addr(IPADDR);
	printf("addr = 0x%x\n",addr);
	return 0;
}

// 0x66  01  a8  c0
//  102  1  168  192

补充说明

（1）为sockaddr_in成员赋值时，需要显式地将主机字节序转换为网络字节序，所以需要调用htons、inet_addr函数。而通过 write/send 发送数据时，TCP协议会自动将数据转换为网络字节序，不需要再调用相应的函数。

（2）关于inet_addr函数的内部代码是怎样的，这里不详细列出。有兴趣可以查阅手册。