C++ TinyWebServer项目总结(5. Linux网络编程基础API)

还是给我的语雀文档打个广告: 《5. C++ TinyWebServer项目总结(5. Linux网络编程基础API)》我的文章都是先在语雀里记录的,然后再同步发送到CSDN上,有些格式问题实在是懒得改了,可能会导致大家看的不舒服,建议有需要的大家可以看看我的原文:

语雀icon-default.png?t=N7T8https://www.yuque.com/u39624144/zvaea9/xdkson4kiaas4lx6?singleDoc#%20%E3%80%8AWebServer%E3%80%8B

主机字节序和网络字节序

现代 CPU 的累加器一次都能装载(至少)4个字节(对于 32 位的机器),即一个 int 类型。那么这4个字节在内存中排列的顺序将影响它被累加器装载的整数值,这就是字节序问题。

字节存储顺序主要分为大端序(Big-endian)和小端序(Little-endian),区别如下

  • Big-endian:高位字节存入低地址,低位字节存入高地址
  • Little-endian:低位字节存入低地址,高位字节存入高地址

例如,将12345678h写入1000h开始的内存中,以大端序和小端序模式存放结果如下:

现代 PC 大多采用小端字节序,因此小端字节序又称为主机字节序;

而在两台不同字节序的主机之间传递数据时,发送端总是把要发送的数据转化成大端字节序数据后再发送,因此大端字节序也被称为网络字节序。

网络字节顺序是TCP / IP中规定好的一种数据表示格式,它与具体的CPU类型、操作系统等无关,从而可以保证数据在不同主机之间传输时能够被正确解释,网络字节顺序采用大端排序方式。

“大同小异 ”:大端字节序的 字节顺序 和 内存地址顺序相同;小端字节序则相反。

通用 socket 地址和专用 socket 地址

socket 网络编程接口中表示 socket 地址是结构体 sockaddr,其定义如下:

#include <bits/socket.h>

struct sockaddr{                           
    sa_family_t sa_family;
    char sa_data[14];
};

typedef unsigned short int sa_family_t;

sa_family成员是地址族类型(sa_family_t)的变量。地址族类型通常与协议类型对应。常见的协议族和对应的地址族如下所示:

sa_data成员用于存放socket地址值。但是,不同的协议族的地址值具有不同的含义和长度 :

可以看到,14个字节只能装下 IPv4地址,没办法装下IPv6的地址。因此,该结构体表示方式已经被废掉,Linux定义了下面这个新的通用的socket地址结构体,这个结构体不仅提供了足够大的空间用于存放地址值,而且是内存对齐的(内存对齐可以加快CPU访问速度)

#include <bits/socket.h>
struct sockaddr_storage
{
    sa_family_t sa_family;
    unsigned long int __ss_align; //不用管,用来作内存对齐的
    char __ss_padding[ 128 - sizeof(__ss_align) ];
};
typedef unsigned short int sa_family_t;

Linux 为各个协议族提供了专门的 socket 地址结构体。

UNIX 本地域协议族使用如下专用的 socket 地址结构体:


#include <sys/un.h>
struct sockaddr_un
{
    sa_family_t sin_family; /* 地址族: AF_UNIX */
    char sun_path[108];     /* 文件路径名 */
};

TCP / IP 协议族有 sockaddr_insockaddr_in6 两个专用的 socket 地址结构体,它们分别用于 IPv4 和 IPv6:

#include <netinet/in.h>
struct sockaddr_in
{
    sa_family_t sin_family;         /* 地址族: AF_INET */
    in_port_t sin_port;             /* 端口号: 用网络字节序表示 */
    struct in_addr sin_addr;        /* IPv4地址结构体 */
};

struct in_addr
{
    u_int32_t s_addr;				/* IPv4地址, 用网络字节序表示 */
};

struct sockaddr_in6
{
    sa_family_t sin6_family;		/* 地址族: AF_INET6 */
    in_port_t sin6_port; 			/* 端口号: 用网络字节序表示 */
    uint32_t sin6_flowinfo; 		/* IPv6 flow information */
    struct in6_addr sin6_addr; 		/* IPv6 地址结构体 */
    uint32_t sin6_scope_id; 		/* IPv6 scope-id */
};

struct in6_addr
{
    unsigned char sa_addr[16];		/* IPv6 地址, 用网络字节序表示 */
};

所有专用 socket 地址(以及 sockaddr_storage)类型的变量在实际使用时都需要转化为通用 socket 地址类型 sockaddr(强制转化即可),因为所有 socket 编程接口使用的地址参数类型都是 sockaddr。

IP 地址转换函数

人们习惯用可读性好的字符串来表示IP地址,比如用点分十进制字符串表示IPV4地址,以及用十六进制字符串表示IPv6地址,但编程中我们需要先把他们转化为整数(二进制)方能使用。而记录日志相反,我们需要把整数表示的IP地址转化为可读的字符串。

/*
    #include <arpa/inet.h>
    // p:点分十进制的IP字符串,n:表示network,网络字节序的整数
    int inet_pton(int af, const char *src, void *dst);
        af: 地址族: AF_INET  AF_INET6
        src: 需要转换的点分十进制的IP字符串
        dst: 转换后的结果保存在这个里面

    // 将网络字节序的整数,转换成点分十进制的IP地址字符串
    const char *inet_ntop(int af, const void *src, char *dst, socklen_t size);
        af: 地址族: AF_INET  AF_INET6
        src: 要转换的ip的整数的地址
        dst: 转换成IP地址字符串保存的地方
        size:第三个参数的大小(数组的大小)
        返回值:返回转换后的数据的地址(字符串),和 dst 是一样的

*/

#include <stdio.h>
#include <arpa/inet.h>

int main() {

    // 创建一个ip字符串, 点分十进制的IP地址字符串
    char buf[] = "192.168.1.0";
    unsigned int num = 0;

    // 将 点分十进制的IP字符串 转换成 网络字节序的整数
    inet_pton(AF_INET, buf, &num);
    unsigned char *p = (unsigned char *)&num;
    printf("%d %d %d %d\n", *p, *(p+1), *(p+2), *(p+3));


    // 将 网络字节序的IP整数 转换成 点分十进制的IP字符串
    char ip[16] = ""; //字符串 IP 地址四段,每段最多三个字节,加上3个“.”,再加一个字符串结束符
    const char * str =  inet_ntop(AF_INET, &num, ip, 16);
    printf("str : %s\n", str);
    printf("ip : %s\n", ip);
    printf("%d\n", ip == str);

    return 0;
}

一个 IPv4 地址,如果用字符串数组来存储,最多需要多大的字符串数组?

  • IPv4 地址格式:
    • IPv4 地址是由四个八位字节(每个0-255之间)组成,每个字节以 . 分隔。
    • 一个完整的 IPv4 地址的格式示例为 255.255.255.255,这个是最大可能的字符串长度。
  • 字符数计算:
    • 每个字节(0-255)可以用 1 到 3 个字符表示(如 0, 10, 255)。
    • 四个字节之间有三个 . 分隔符。
    • 因此,最大长度的 IPv4 地址字符串是 xxx.xxx.xxx.xxx,总共 15 个字符。
  • 字符串结束符:
    • C 语言中的字符串以 \0 结束符结尾,所以需要额外的 1 个字节空间来存储这个结束符。

因此,字符串数组大小应该为 16 ,才可以存储最完整的 IPv4 地址字符串形式(15个字符 xxx.xxx.xxx.xxx)和一个结束符(\0)。

创建 socket

#include <sys/types.h>
#include <sys/socket.h>
#include <arpa/inet.h>//包含了这个头文件,上面两个就可以省略

int socket(int domain,int type,int protoco1);

功能:创建一个套接字

参数:

domain:底层协议族

    • PF_INET:IPv4
    • PF_INET6:IPv6
    • PF_UNIX:UNIX 本地域协议族

type:指定通信过程中使用的服务类型

    • SOCK_STREAM:流服务(TCP等)
    • SOCK_DGRAM:数据报服务(UDP等)
    • 自 Linux 内核版本 2.6.17 起,type 参数可以接受上述服务类型与下面两个重要的标志相与的值:SOCK_NONBLOCKSOCK_CLOEXEC,前者将 socket 设置为非阻塞的。

protocol:在前两个参数构成的协议集合下,再选择一个具体的协议。一般设置为 0(因为前面两个参数已经完全决定了它的值)

返回值:

成功:返回 socket 文件描述符,操作的就是内核缓冲区

失败:返回-1 并设置 errno

命名 socket

即将一个 socket 与 socket 地址绑定。

int bind(int sockfd,const struct sockaddr* my_addr,socklen_t addrlen);

功能:my_addr 所指的 socket 地址分配给未命名的 sockfd 文件描述符,addrlen 指出 socket 地址长度。

参数:

sockfd:通过socket函数得到的文件描述符

my_addr:需要绑定的 socket 地址,这个地址封装了ip 地址和端口号的信息

addrlen:第二个参数结构体占的内存大小

返回值:

成功:返回 0

失败:返回-1 并设置 errno

监听 socket

socket 被命名后,还不能马上接受客户连接,需要使用如下系统调用,创建一个监听队列,存放待处理的客户连接:

int listen(int sockfd,int backlog);

功能:监听指定 socket上的连接

参数:

sockfd:通过socket()函数得到的文件描述符,指定被监听的 socket

backlog:提示内核监听队列的最大长度,超过该设定的最大值,服务器将不受理新的客户连接。

返回值:

成功:返回 0

失败:返回 -1 并设置 errno

接受连接

int accept(int sockfd,struct sockaddr *addr ,sock1en_t *addrlen);

功能:从 listen 监听队列中接受一个连接。accept 只是从监听队列中取出连接,而不关心连接处于何种状态。

参数:
sockfd:执行过 listen 系统调用的监听 socket
addr:记录了连接成功后客户端的地址信息(socket 地址)
addrlen:指定第二个参数的 socket 地址长度。
返回值:
成功:返回一个新的连接 socket,该 socket 唯一标识了被接受的这个连接,服务器可以通过读写该 socket 来与被接受连接的客户端通信。
失败:返回-1 并设置 errno

发起连接

服务器通过 listen 调用来被动接受连接,而客户端通过 connect 来主动与服务器发起连接。

int connect(int sockfd,const struct sockaddr *serv_addr,socklen_t addr1en);

参数:
sockfd:用于通信的文件描述符,由 socket 系统调用返回。
addr:客户端要连接的服务器的地址信息,即服务器监听的 socket 地址。
addrlenaddr 的地址长度。

返回值:

成功:返回0,连接成功建立,则 sockfd 唯一标识这个连接,客户端可以通过读写 sockfd 来与服务器通信。

失败:返回 -1并设置 errno

关闭连接

int close (int fd);

功能:关闭该连接对应的 socket

参数:

fd:待关闭的 socket。注意,close 调用并非总是立即关闭一个连接,而是将 fd 的引用计数减一。当引用计数为 0 时,才真正关闭这个连接。如果要立即终止连接,可以使用 shutdown 系统调用:

int shutdown(int sockfd, int howto);

功能:立即关闭该连接对应的 socket

参数:

sockfd:待关闭的 socket。

howto:决定了 shutdown 的行为。

    • SHUT_RD:断开输入流。套接字无法接收数据(即使输入缓冲区收到数据也被抹去),无法调用输入相关函数。
    • SHUT_WR:断开输出流。套接字无法发送数据,但如果输出缓冲区中还有未传输的数据,则将传递到目标主机。
    • SHUT_RDWR:同时断开 I/O 流。相当于分两次调用 shutdown(),其中一次以 SHUT_RD 为参数,另一次以 SHUT_WR 为参数。

返回值:

成功:返回0

失败:返回 -1并设置 errno

shutdown 可以分别关闭 socket 上的读和写,而 close 只能同时关闭。

数据读写

TCP 数据读写

用于 TCP 流数据的读写调用:

#include <sys/types.h>
#include <sys/socket.h>

ssize_t recv(int sockfd, void *buf, size_t len, int flags)
ssize_t send(int sockfd, const void *buf, size_t len, int flags)

recv()成功时返回实际读取到的数据长度,可能小于指定读缓冲区的大小 len,因此可能需要多次调用才能读取完整数据。返回 0 说明对方已经关闭连接。返回-1 说明出错;

send()成功时返回实际写入 sockfd 的数据长度

flags 参数为数据收发提供了额外的控制。只对 sendrecv 的当前调用生效。而 setsockopt 可以永久修改 socket 的某些属性。

UDP 数据读写

系统调用是:

#include <sys/types.h>
#include <sys/socket.h>

ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,
                 struct sockaddr *src_addr, socklen_t *addrlen);
ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,
               const struct sockaddr *dest_addr, socklen_t addrlen);

recvfrom

参数:

sockfd:一个已打开的套接字的描述符。

buf:一个指针,指向读缓冲区。

len:读缓冲区的大小(以字节为单位)。

src_addr:一个指针,指向发送端的 socket 地址。(UDP 是无连接的,每次通信都需要指定通信地址)

addrlen:开始时,它应该设置为 src_addr 缓冲区的大小。当 recvfrom() 返回时,该值会被修改为实际地址的长度(以字节为单位)。

flags:控制接收行为的标志。通常可以设置为0。

返回值:

在成功的情况下,recvfrom() 返回接收到的字节数。

如果没有数据可读或 socket 已经关闭,那么返回值为0。

出错时,返回 -1,并设置全局变量 errno 以指示错误类型。

sendto:与recvfrom类似。

实际上,recvfromsendto也可以用于面向连接的 socket 的数据读写,当连接已经建立时,只需要把recvfrom/sendtosrc_addraddrlen设置为 NULL,即可忽略发送端/接收端的 socket 地址。

通用数据读写

不仅能用于 TCP 流数据,还能用于 UDP 数据报。

#include <sys/socket.h>

ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags);
ssize_t recvmsg(int sockfd, const struct msghdr *msg, int flags);

带外标记

Linux内核检测到TCP紧急标志时,将通知应用程序有带外数据需要接收。内核通知应用程序带外数据到达的两种常见方式是:I/O复用产生的异常事件和SIGURG信号。但是,即使应用程序得到了有带外数据需要接收的通知,还需要知道带外数据在数据流中的具体位置,才能准确接收带外数据。这一点可通过如下系统调用实现:

#include <sys/socket.h>
int sockatmark( int sockfd );

sockatmark 判断 sockfd 是否处于带外标记,即下一个被读取到的数据是否是带外数据。

如果是,sockatmark返回1,此时我们就可以利用带MSG_OOB标志的recv调用来接收带外数据。如果不是,则sockatmark返回0。

地址信息函数

在某些情况下,我们想知道一个连接socket的本端socket地址,以及远端的socket地址。下面这两个函数正是用于解决这个问题:

#include <sys/socket.h>

int getsockname( int sockfd,struct sockaddr* address,socklen t* address_len );
int getpeername( int sockfd,struct sockaddr* address, socklen t* address_len );

getsockname获取sockfd 对应的本端socket地址,并将其存储于address参数指定的内存中,该socket地址的长度则存储于address_len参数指向的变量中。如果实际socket地址的长度大于 address所指内存区的大小,那么该socket地址将被截断。getsockname 成功时返回0,失败返回-1并设置 errno。

getpeerame 获取 sockfd对应的远端socket地址,其参数及返回值的含义与 getsockname的参数及返回值相同。

socket 选项

用来读取和设置socket文件描述符属性的方法:

#include <sys/socket.h>

int getsockopt( int sockfd, int level,int option_name, 
                    void* option_value, socklen_t* restrict option_len );
int setsockopt( int sockfd, int level,int option_name, 
                    const void* option_value, socklen_t option_len );

实战:TCP通信实现(服务器端和客户端)

接下来,我们通过一个实战小项目,来更加深刻的理解 TCP 通信和 socket 的使用。项目代码来自:【Linux】socket 编程(socket套接字介绍、字节序、socket地址、IP地址转换函数、套接字函数、TCP通信实现)_linux socket-CSDN博客

整个流程经历了以下阶段:

  1. 在代码中,服务器端先通过socket调用,创建了一个 socket;
  2. 服务器端调用 bind 将 socket 绑定到一个 IP 地址和端口号;
  3. 服务器端调用 listen 使 socket 进入监听状态,准备接收客户端的连接请求;
  4. 客户端调用 connect,发起连接请求;
  5. 服务器端调用 accept,接受客户端的连接请求;
  6. TCP 连接建立,可以通过 read/write 收发数据。

服务器端

#include <stdio.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <string.h>
#include <stdlib.h>

/* TCP服务器端实现 */
int main() {

    /*
     * 1.创建socket(用于监听的套接字):
     *  使用 socket 函数创建一个套接字 listen_fd
     *  AF_INET: 表示使用 IPv4 协议
     *  SOCK_STREAM: 表示使用 TCP 连接。
     */  
    int listen_fd = socket(AF_INET, SOCK_STREAM, 0);

    if(listen_fd == -1) {
        perror("socket");
        exit(-1);
    }

    /*
     * 2.绑定/命名 socket: 
     *  struct sockaddr_in 用于指定服务器的地址和端口。
     *  INADDR_ANY 让服务器绑定到所有可用的网络接口(即可以接受任何 IP 地址的连接)。
     *  使用 bind 函数将套接字与指定的 IP 地址和端口绑定。
     *  如果 bind 返回 -1,表示绑定失败,输出错误信息并退出程序。
     */
    struct sockaddr_in saddr;
    saddr.sin_family = AF_INET;
    saddr.sin_addr.s_addr = INADDR_ANY;  // 0.0.0.0
    saddr.sin_port = htons(9999);
    int ret = bind(listen_fd, (struct sockaddr *)&saddr, sizeof(saddr));

    if(ret == -1) {
        perror("bind");
        exit(-1);
    }

    /*
     * 3.监听连接
     *  listen 函数使套接字进入监听状态,准备接收来自客户端的连接请求。
     *  第二个参数 8 指定了连接队列的最大长度,即最多可以有 8 个连接请求排队等待处理。
     *  如果 listen 返回 -1,表示监听失败,输出错误信息并退出程序。
     */ 
    ret = listen(listen_fd, 8);
    if(ret == -1) {
        perror("listen");
        exit(-1);
    }

    /*
     * 4.接收客户端连接
     *  使用 accept 函数接受客户端的连接请求,accept 返回一个新的套接字 cfd,用于与客户端通信。
     *  clientaddr 用于存储客户端的地址信息。
     *  如果 accept 返回 -1,表示接收连接失败,输出错误信息并退出程序。
    */
    struct sockaddr_in clientaddr;
    socklen_t len = sizeof(clientaddr);
    int cfd = accept(listen_fd, (struct sockaddr *)&clientaddr, &len);
    
    if(cfd == -1) {
        perror("accept");
        exit(-1);
    }

    /*
     * 5. 输出客户端的信息
     *  inet_ntop 函数将客户端的 IP 地址从网络字节序转换为点分十进制字符串格式,并输出。
     *  ntohs 函数将客户端的端口号从网络字节序转换为主机字节序,并输出。
     */
    char clientIP[16];
    inet_ntop(AF_INET, &clientaddr.sin_addr.s_addr, clientIP, sizeof(clientIP));
    unsigned short clientPort = ntohs(clientaddr.sin_port);
    printf("client ip is %s, port is %d\n", clientIP, clientPort);

    // 6.通信
    char recvBuf[1024] = {0};
    while(1) {
        
        // 获取客户端的数据
        int num = read(cfd, recvBuf, sizeof(recvBuf));
        if(num == -1) {
            perror("read");
            exit(-1);
        } else if(num > 0) {
            printf("recv client data : %s\n", recvBuf);
        } else if(num == 0) {
            // 表示客户端断开连接
            printf("clinet closed...");
            break;
        }

        char *data = "hello,i am server";
        // 给客户端发送数据
        write(cfd, data, strlen(data));
    }
   
    // 7. 关闭文件描述符
    close(cfd);
    close(listen_fd);

    return 0;
}

客户端

#include <stdio.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <string.h>
#include <stdlib.h>

/* TCP客户端实现 */
int main() {

    // 1.创建套接字: AF_INET 表示使用 IPv4 地址,SOCK_STREAM 表示使用 TCP 连接。
    int fd = socket(AF_INET, SOCK_STREAM, 0);
    if(fd == -1) {
        perror("socket");
        exit(-1);
    }

    // 2.连接服务器端: 设定服务器的 IP 地址和端口号(此处为 "10.1.1.161" 和 9999)。
    struct sockaddr_in serveraddr;
    serveraddr.sin_family = AF_INET;
    inet_pton(AF_INET, "10.1.1.161", &serveraddr.sin_addr.s_addr);
    serveraddr.sin_port = htons(9999);
    int ret = connect(fd, (struct sockaddr *)&serveraddr, sizeof(serveraddr));

    if(ret == -1) {
        perror("connect");
        exit(-1);
    }

    
    // 3.通信
    char recvBuf[1024] = {0};
    while(1) {

        char *data = "hello,i am client";
        // 通过 write 函数发送消息 "hello,i am client" 到服务器。
        write(fd, data , strlen(data));

        sleep(1);
        
        int len = read(fd, recvBuf, sizeof(recvBuf));
        if(len == -1) {
            perror("read");
            exit(-1);
        } else if(len > 0) {
            printf("recv server data : %s\n", recvBuf);
        } else if(len == 0) {
            // 如果 read 返回 0,表示服务器关闭了连接,客户端程序将结束循环并关闭连接。
            printf("server closed...");
            break;
        }
    }
    
    // 4. 关闭连接
    close(fd);

    return 0;
}

效果

编译运行上述代码,在终端中可以看单到:

参考

  1. 大端序和小端序_大端序和小端序的区别-CSDN博客
  2. C++的socket地址详解_如何定义c socket ip地址-CSDN博客
  3. 深入理解TCP协议及其源代码-send和recv背后数据的收发过程 - zhqian - 博客园
  4. Linux网络编程- recvfrom() & sendto()-CSDN博客
  5. recvmsg 和 sendmsg 函数详解 以及如何进行多进程之间文件描述符的发送与接收-CSDN博客
  6. 【Linux】socket 编程(socket套接字介绍、字节序、socket地址、IP地址转换函数、套接字函数、TCP通信实现)_linux socket-CSDN博客
  • 26
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

红茶川

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值