与socket网络编程有关的函数

以下内容源于网络资源的学习与整理,如有侵权请告知删除。

目录

一、与服务器端有关的函数

1.1 socket函数

1.2 bind函数

1.3 listen函数

1.4 accept函数

二、与客户端有关的函数

2.1 socket函数

2.2 connect函数

三、常见通用的函数 

3.1 write函数

3.2 read函数

3.3 send函数

3.4 recv函数

3.5 htons函数

3.6 inet_addr函数


下面这些函数所涉及的头文件以及更多细节,可以利用man手册查阅,比如“man 3 recv”可以查阅recv函数(1shell,2api,3库)。

一、与服务器端有关的函数

服务器端涉及以下函数:

(1)socket函数:创建一个网络套接字,获取网络连接的文件描述符。

(2)bind函数:将服务器的端口、IP地址与socket函数创建的文件描述符绑定。

(3)listen函数:监听服务器的当前端口(其他端口不监听)。

(4)accept函数,阻塞以等待用户连接。

1.1 socket函数

函数原型

int socket(int af, int type, int protocol);
         //IP地址  //套接字类型  //传输协议

函数作用

此函数用来创建一个网络套接字,并确定套接字的各种属性。该函数返回一个socket的文件描述符,是int类型的整数。

参数说明

(1)af,表示IP地址类型。可取值为 AF_INET(表示IPv4 地址)、AF_INET6(表示IPv6 地址)。

(2)type,表示数据传输方式(或者说套接字类型)。可取值为 SOCK_STREAM(表示流格式套接字、面向连接的套接字)、SOCK_DGRAM(表示数据报套接字、无连接的套接字)。

(3)protocol,表示传输协议,常用选项包括 IPPROTO_TCP(表示TCP 传输协议)、IPPTOTO_UDP(表示UDP传输协议)。

补充说明

(1)socket函数在<sys/socket.h> 头文件中,调用该函数时要包含该文件。

(2)为什么需要指定protocol这个参数?

一般情况下,我们指定 af 和 type 参数就可以创建套接字了,操作系统会自动推演出协议类型(此时protocol参数的值可以设置为0),除非有两种不同的协议支持同一种地址类型和数据传输类型,此时操作系统没办法自动推演,需要指定protocol这个参数。

比如使用IPv4地址而且使用 SOCK_STREAM 传输数据的协议只有 TCP,那么操作系统会自动推导出协议类型为TCP,那么调用socket函数的方式有两种:将protocol的值设为0,或者显式地设为 IPPROTO_TCP,如下所示:

int tcp_socket = socket(AF_INET, SOCK_STREAM, 0);
//或者
int tcp_socket = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);

1.2 bind函数

函数原型

int bind(int sock, struct sockaddr *addr, socklen_t addrlen);  
                   //服务器端的IP和端口信息

函数作用

此函数将(服务器端的)套接字与(服务器端的)特定的IP地址、端口绑定起来。

绑定之后,流经该IP地址、端口的数据才能交给这个套接字处理。

参数说明

(1)sock,表示(服务器端)使用socket函数创建套接字时,所返回的文件描述符。

(2)addr,表示指向(struct sockaddr 这个结构体类型所定义的、表示服务器端的)变量的指针。

(3)addrlen,表示struct sockaddr 结构体类型所定义的变量的大小,可由 sizeof() 计算得出。

代码分析

下面代码的作用,是将创建的套接字与IP地址 127.0.0.1、端口 1234 绑定。

//创建套接字
int serv_sock = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);

//创建sockaddr_in结构体变量
struct sockaddr_in serv_addr;
memset(&serv_addr, 0, sizeof(serv_addr)); //每个字节都用0填充
serv_addr.sin_family = AF_INET; //使用IPv4地址
serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); //具体的IP地址
serv_addr.sin_port = htons(1234); //端口

//将套接字和IP、端口绑定
bind(serv_sock, (struct sockaddr*)&serv_addr, sizeof(serv_addr));
                //这里进行数据类型强制转化

(1) struct sockaddr_in 结构体

我们来看一下struct sockaddr_in 结构体的定义:

struct sockaddr_in{
    sa_family_t sin_family; //地址族(Address Family),也就是地址类型
    uint16_t sin_port; //16位的端口号
    struct in_addr sin_addr; //32位IP地址
    char sin_zero[8]; //不使用,一般用0填充
};
  • sin_family 和 socket 函数的第一个参数的含义相同,取值也保持一致(不过它是unsigned short类型的,占两个字节,而socket 函数的第一个参数是int类型的,占4个字节)。
  • sin_prot 为端口号。uint16_t 的长度为两个字节,理论上端口号的取值范围为 0~65536,但是 0~1023 的端口一般由系统分配给特定的服务程序,例如 Web 服务的端口号为 80,FTP 服务的端口号为 21,所以我们的程序要尽量在 1024~65536 之间分配端口号。
  • sin_addr 是 struct in_addr 结构体类型的变量。
  • sin_zero[8] 是多余的8个字节,没有用,一般使用 memset() 函数填充为 0。

这里的 struct in_addr 结构体只包含一个成员,如下所示:

struct in_addr{
    in_addr_t s_addr; //32位的IP地址
};

in_addr_t 在头文件 <netinet/in.h> 中定义,它等价于 unsigned long,长度为4个字节。这说明 s_addr 是一个整数,而代码中定义的IP地址是字符串“127.0.0.1”,所以上面代码中使用 inet_addr() 函数进行转换。转后serv_addr.sin_addr.s_addr =16777343。

为什么要搞这么复杂,struct sockaddr_in结构体中嵌套struct in_addr结构体,而不用 sockaddr_in 的一个成员变量来直接指明IP地址呢?另外,socket() 函数的第一个参数已经指明了地址类型,为什么在 sockaddr_in 结构体中还要再说明一次呢?这些繁琐的细节确实给初学者带来了一定的障碍,我想,这或许是历史原因吧,后面的接口总要兼容前面的代码。

(2)struct sockaddr 结构体

上述代码先创建 struct sockaddr_in 类型变量,然后在bind()函数中强制转换为 struct sockaddr 类型。为何不直接创建 struct sockaddr 类型变量呢?毕竟bind()函数第二个参数类型就是 struct sockaddr 类型的 。

我们看一下struct sockaddr 结构体的定义:

struct sockaddr{
    sa_family_t sin_family; //地址族(Address Family),也就是地址类型
    char sa_data[14]; //IP地址和端口号
};

下图是 struct sockaddr 与 struct sockaddr_in 的对比(括号中的数字表示所占用的字节数):

可见struct sockaddr 和 struct sockaddr_in 的长度相同,都是16字节,只是将IP地址和端口号合并到一起,用一个成员 sa_data 表示。要想给 sa_data 赋值,必须同时指明IP地址和端口号,例如”127.0.0.1:80“。遗憾的是,没有相关函数将这个字符串转换成需要的形式,也就很难给 sockaddr 类型的变量赋值,所以使用 sockaddr_in 来代替。这两个结构体的长度相同,强制转换类型时不会丢失字节,也没有多余的字节。

可以认为,struct sockaddr 是一种通用的结构体,可以用来保存多种类型的IP地址和端口号,但由于它使用不便,才针对不同的地址类型定义了不同的结构体,然后在使用的时候再强制类型转换。比如 struct  sockaddr_in 是专门用来保存 IPv4 地址的结构体;而struct sockaddr_in6是专门用来保存 IPv6 地址的结构体,它的定义如下:

struct sockaddr_in6 {
    sa_family_t sin6_family; //(2)地址类型,取值为AF_INET6
    in_port_t sin6_port; //(2)16位端口号
    uint32_t sin6_flowinfo; //(4)IPv6流信息
    struct in6_addr sin6_addr; //(4)具体的IPv6地址
    uint32_t sin6_scope_id; //(4)接口范围ID
};

1.3 listen函数

函数原型

int listen(int sock, int backlog);

函数作用

该函数可以让(服务器端的)套接字进入被动监听状态。

参数说明

(1)sock,表示(服务器端的)需要进入监听状态的套接字的文件描述符。

(2)backlog,表示请求队列的最大长度。

补充说明

(1)被动监听

指当没有客户端请求时,套接字处于“睡眠”状态,只有当接收到客户端请求时,套接字才会被“唤醒”来响应请求。

(2)请求队列

当套接字正在处理客户端请求时,如果有新的请求进来,套接字是没法处理的,只能把它放进缓冲区,待当前请求处理完毕后,再从缓冲区中读取出来处理。如果不断有新的请求进来,它们就按照先后顺序在缓冲区中排队,直到缓冲区满。这个缓冲区,就称为请求队列(Request Queue)。

缓冲区的长度(能存放多少个客户端请求)可以通过 listen() 函数的 backlog 参数指定,但究竟为多少并没有什么标准,可以根据你的需求来定,并发量小的话可以是10或者20。

如果将 backlog 的值设置为 SOMAXCONN,就由系统来决定请求队列长度,这个值一般比较大,可能是几百,或者更多。

当请求队列满时,就不再接收新的请求。对于 Linux,客户端会收到 ECONNREFUSED 错误,对于 Windows,客户端会收到 WSAECONNREFUSED 错误。

(3)listen函数只是让套接字处于监听状态,并没有接收请求,接收请求需要使用 accept 函数。

1.4 accept函数

函数原型

int accept(int sock, struct sockaddr *addr, socklen_t *addrlen);
//参数1:服务器端创建的套接字文件描述符          
//参数2:保存了客户端的IP和端口号信息

函数作用

当(服务器端的)套接字处于监听状态时,可以通过accept函数来接收客户端请求。

如果该函数返回一个新的套接字的文件描述符,则表示服务器和客户端成功建立一个TCP连接。

参数说明

(1)sock,表示(服务器端)创建的套接字的文件描述符。

(2)addr,表示指向(struct sockaddr_in这个结构体变量所定义的、表示客户端的)变量的指针。

(3)addrlen,表示addr这个指针指向的变量所占空间大小,可由 sizeof() 求得。

补充说明

(1)该函数的第一个参数 sock 是服务器端创建的套接字的文件描述符(我们把它叫做监听fd),而该函数的返回值是一个新的套接字的文件描述符(我们把它叫做连接fd)。编写代码的时候要特别注意:服务器端和客户端通信时,服务器端要使用连接fd,不再使用监听fd。

(2)addr保存了客户端(注意不是服务器端)的IP地址和端口号。

(3)listen函数只是让套接字进入监听状态,并没有真正接收客户端请求,listen函数后面的代码会继续执行,直到遇到 accept函数。accept函数会阻塞程序执行(后面代码不能被执行),以等待客户端的连接。

二、与客户端有关的函数

客户端涉及以下函数: 

(1)socket函数:获取网络连接的文件描述符。

(2)connect函数:连接服务器。

连接上之后:

(3)send函数:客服端给服务器发送数据。

(4)recv函数:客服端接收服务器的回复。

2.1 socket函数

同1.1。

2.2 connect函数

函数原型

#include <sys/socket.h>
int connect(int socket, const struct sockaddr *address, socklen_t address_len);

函数作用

该函数在客户端和服务器端之间建立连接。

参数说明

(1)socket,表示(客户端)使用socket函数创建套接字时,所返回的文件描述符。

(2)address,表示指向(struct sockaddr_in这个结构体变量所定义的、表示服务器端的)变量的指针。

(3)address_len,表示address这个指针所指向的变量所占空间大小,可由 sizeof() 求得。

三、常见通用的函数 

Linux平台和Windows平台,对于socket,使用不同的发送函数、接收函数。Linux不区分套接字文件和普通文件,统一使用write、read函数,比如使用 write 向套接字中写入数据,使用 read 从套接字中读取数据。Windows区分普通文件和套接字,并定义了专门的接收和发送的函数,即send函数和recv函数。

学习下面内容前,先建立这样的认识:对于socket机制,它内部设置有接收缓冲区和发送缓冲区。利用 write 或者 send 函数,可以把我们想要发送给对方的内容(这些内容目前放在我们自己设置的缓冲区里,而且这个缓冲区与socket自带的接收/发送缓冲区,是不同的缓冲区),拷贝到socket的发送缓冲区中,然后它会自动完成发送;同样地,利用 read 或者 recv 函数,可以将对方发送给我们的数据,从socket的接收缓冲区中,拷贝到我们自己设置的缓冲区里)。

3.1 write函数

函数原型

#include <unistd.h>
ssize_t write(int fildes, const void *buf, size_t nbyte);

函数作用

该函数将缓冲区buf中的nbytes个字节,写入文件描述符fildes对应的文件中,成功则返回写入的字节数,失败则返回 -1。

参数说明

(1)fildes,表示要将数据写入哪个文件中(该文件所对应的文件描述符)。比如服务器要向客户端发送数据,则这里的fildes一般是accept函数返回的连接fd

(2)buf,表示待写入的数据目前存放在哪个地址。

(3)nbytes,表示要写入多少字节的数据。

3.2 read函数

函数原型

ssize_t read(int fd, void *buf, size_t nbytes);

函数作用

从文件描述符fd对应的文件中读取 nbytes 个字节,并保存到缓冲区 buf。

该函数读取成功,则返回读取到的字节数(但遇到文件结尾则返回0),读取失败则返回 -1。

参数说明

(1)fd,表示要读取的文件对应的文件描述符。客户端想要接收服务器发给它的数据时,则这里一般是客户端自身使用socket函数所获取的套接字文件描述符。

(2)buf,表示要将数据读到哪个地方。

(3)nbytes,表示要读取多少字节的数据。size_t 是通过 typedef 声明的 unsigned int 类型。

3.3 send函数

函数模型

#include <sys/socket.h>
ssize_t send(int socket, const void *buffer, size_t length, int flags);

函数作用

该函数用来将信息发送到一个套接字中,即把缓冲区 buffer 中的 length 个字节写入文件描述符socket对应的文件中。

(1)ssize_t类型,相当于long。

(2)socket,表示要发送数据的套接字的文件描述符。比如服务器要向客户端发送数据,则这里的socket一般是accept函数返回的连接fd。

(3)buffer,表示要发送的消息(或者说要发送的数据目前存放在哪里)。

(4)length,表示要发送多少字节的数据。

(5)flags,该参数一般设置为 0 或 NULL,初学者不必深究。

补充说明

(1)send函数只能在套接字处于连接状态的时候才能使用,因为只有这样才知道接收者是谁。

(2)send函数与 write函数的唯一区别,在于send函数的最后一个参数。当设置flags为0时,send和wirte是同等的。

(3)当消息不适合套接字的发送缓冲区时,send通常会阻塞,除非事先将套接字设置为非阻塞的模式(那样就不会阻塞,而是返回EAGAIN或者EWOULDBLOCK错误,此时可以调用select函数来监视何时可以发送数据)。

3.4 recv函数

函数模型

#include <sys/socket.h>
ssize_t recv(int socket, void *buffer, size_t length, int flags);

函数作用

该用于从一个已连接的socket中接收信息,也就是从socket文件中拷贝信息到缓冲区buffer中,拷贝的长度是length。

参数说明

(1)socket,表示已连接套接字的文件描述符。客户端想要接收服务器发给它的数据时,则这里一般是客户端自身使用socket函数所获取的套接字文件描述符。

(2)buffer,表示把接收到的数据存放在哪里。

(3)length,表示要接收多少字节的数据。

(4)flags,表示标志位,它会影响函数的行为,比如控制是否阻塞函数等等。

3.5 htons函数

函数模型

uint16_t htons(uint16_t hostshort)

函数作用

该函数用来将当前主机字节序转换为网络字节序(即转换成大端模式)。

代码示例

//创建sockaddr_in结构体变量
struct sockaddr_in serv_addr;
memset(&serv_addr, 0, sizeof(serv_addr));  //每个字节都用0填充
serv_addr.sin_family = AF_INET;  //使用IPv4地址
serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1");  //具体的IP地址
serv_addr.sin_port = htons(1234);  //端口号

补充说明

(1)网络字节序是大端模式,而x86架构的cpu一般是小端模式,所以需要进行转换。

(2)htons这字母组合中,h 代表主机字节序,n 代表网络字节序,s代表short,可以理解为“将 short 型数据从当前主机字节序转换为网络字节序”。

(3)通常,以s为后缀的函数中,s代表 2 个字节 short,因此用于端口号转换;以l为后缀的函数中,l代表 4 个字节的 long,因此用于 IP 地址转换。常见的网络字节转换函数如下。

  • htons():host to network short,将 short 类型数据从主机字节序转换为网络字节序。
  • ntohs():network to host short,将 short 类型数据从网络字节序转换为主机字节序。
  • htonl():host to network long,将 long 类型数据从主机字节序转换为网络字节序。
  • ntohl():network to host long,将 long 类型数据从网络字节序转换为主机字节序。

3.6 inet_addr函数

函数原型

unsigned long inet_addr( const char *cp )

函数作用

该函数将字符串形式(即点分十进制形式)的IPv4地址(不能处理IPv6地址)转换成32位的长整型,同时还进行网络字节序转换。

代码示例

//创建sockaddr_in结构体变量
struct sockaddr_in serv_addr;
memset(&serv_addr, 0, sizeof(serv_addr));  //每个字节都用0填充
serv_addr.sin_family = AF_INET;  //使用IPv4地址
serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1");  //具体的IP地址
serv_addr.sin_port = htons(1234);  //端口号
#include<netinet/in.h>
#include<arpa/inet.h>
#define IPADDR "192.168.1.102"

int main(void)
{
	int_addr_t addr = 0; //int_addr_t 是 unsigned long
	addr = inet_addr(IPADDR);
	printf("addr = 0x%x\n",addr);
	return 0;
}

// 0x66  01  a8  c0
//  102  1  168  192

补充说明

(1)为sockaddr_in成员赋值时,需要显式地将主机字节序转换为网络字节序,所以需要调用htons、inet_addr函数。而通过 write/send 发送数据时,TCP协议会自动将数据转换为网络字节序,不需要再调用相应的函数。

(2)关于inet_addr函数的内部代码是怎样的,这里不详细列出。有兴趣可以查阅手册。

  • 0
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天糊土

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值