Linux程序设计-网络编程（续）_len = recv(curfd, buf, sizeof(buf), 0);此函数的源码-CSDN博客

本文链接：https://blog.csdn.net/cuisinebird/article/details/132364684

广播

广播的概念

广播实现一对多的通讯
它通过向广播地址发送数据报文实现的

套接字选项

套接字选项用于修饰套接字以及其底层通讯协议的各种行为。函数setsockopt和getsockopt可以查看和设置套接字的各种选项。

int getsockopt(int sockfd, int level, int optname,
				void *optval, socklen_t*optlen);
int setsockopt(int sockfd, int level, int optname,
				const void *optval, socklen_t optlen);

SO BROADCAST选项

SO BROADCAST选项控制着UDP套接字是否能够发送广播数据报，选项的类型为int,非零意味着“是”，注意，只有UDP套接字可以使用这个选项，TCP是不能使用广播的。

int opt= 1;
if((sockfd = socket(AF_INET,SOCK_DGRAM, O))<o)
	//错误处理
}
if(setsockopt(sockfd, SOL_SOCKET,
				SO_BROADCAST,&opt, sizeof(opt)< 0){
	//错误处理
}

SO_SNDBUF和SO_ RCVBUF选项

每一个套接字有一个发送缓冲区和接收缓冲区，这两个缓冲文重底层协议使用.接收缓冲区存放由协议接收的数据置到被应角程序读走,发送缓冲区存放应用写出的数据直到被协议发送茁去。so SNDBU宇F和sO RCVBUF选项分别控制发送和接收缓冲区的天小，他们的类型均为int,以字节为单位。

if((sockfd = socket(AF_INET, SOCK_STREAM,0)) < 0) {
 	//错误处理
}

if(getsockopt(sockfd, SOL_SOCKET, SO_SNDBUF, &opt, sizeof(opt)) < 0) {
 	//错误处理  
}

opt += 2048;

if(setsockopt(sockfd, SOL_SOCKET, SO_SNDBUF, &opt, sizeof(opt)) < 0) {
 	//错误处理
}

广播地址

如果用{net ID, subnetlD, hostID}({网络ID，子网ID，主机ID})表示IPv4地址，那么有四类的广播地址，我们用-1表示所有比特都为1的字段。
子网广播地址:{netlD, subnetlD,-1}。这类地址编排指定子网上的所有接口。例如，如果我们对B类地址192.168采用8位子网ID,那么192.168.2.255将是192.168.2子网上所有接口的子网广播地址。路由器通常不转发这类广播。
全部子网广播地址: {netID,-1，-1}。这类广播地址编抖指手网，罪么现在己很少见了。类地址曾被用过的话，那么现在已很少见了。
受限广播地址:{ -1，-1，-1}或255.255.255.255。路由器从不转发目的地址255.255.255.255的IP数据报。

IO多路转接

IO多路转接也称为IO多路复用，它是一种网络通信的手段（机制），通过这种方式可以同时监测多个文件描述符并且这个过程是阻塞的，一旦检测到有文件描述符就绪（可以读数据或者可以写数据）程序的阻塞就会被解除，之后就可以基于这些（一个或多个）就绪的文件描述符进行通信了。通过这种方式在单线程/进程的场景下也可以在服务器端实现并发。常见的IO多路转接方式有：select、poll、epoll。
下面先对多线程/多进程并发和IO多路转接的并发处理流程进行对比（服务器端）：

多线程/多进程并发
主线程/父进程：调用 accept()监测客户端连接请求
如果没有新的客户端的连接请求，当前线程/进程会阻塞
如果有新的客户端连接请求解除阻塞，建立连接
子线程/子进程：和建立连接的客户端通信
调用 read() / recv() 接收客户端发送的通信数据，如果没有通信数据，当前线程/进程会阻塞，数据到达之后阻塞自动解除
调用 write() / send() 给客户端发送数据，如果写缓冲区已满，当前线程/进程会阻塞，否则将待发送数据写入写缓冲区中
IO多路转接并发
使用IO多路转接函数委托内核检测服务器端所有的文件描述符（通信和监听两类），这个检测过程会导致进程/线程的阻塞，如果检测到已就绪的文件描述符阻塞解除，并将这些已就绪的文件描述符传出
根据类型对传出的所有已就绪文件描述符进行判断，并做出不同的处理
监听的文件描述符：和客户端建立连接
此时调用accept()是不会导致程序阻塞的，因为监听的文件描述符是已就绪的（有新请求）
通信的文件描述符：调用通信函数和已建立连接的客户端通信
调用 read() / recv() 不会阻塞程序，因为通信的文件描述符是就绪的，读缓冲区内已有数据
调用 write() / send() 不会阻塞程序，因为通信的文件描述符是就绪的，写缓冲区不满，可以往里面写数据
对这些文件描述符继续进行下一轮的检测（循环往复。。。）

与多进程和多线程技术相比，I/O多路复用技术的最大优势是系统开销小，系统不必创建进程/线程，也不必维护这些进程/线程，从而大大减小了系统的开销。

fantl函数

（具体参考文件IO的相关内容）
在这里插入图片描述

select函数

#include <sys/types.h>
#include <sys/time.h>
#include <unistd.h>
int select (int maxfdp1, fd_set *readfds, fd_set *writefds,
			fd_set "exceptfds, struct timeval *timeout);
//返回:准备就绪的描述符数，若超时则为0，若出错则为-1
struct timeval{
	long tv_sec;	/*秒 */
	long tv_usec;	/*微秒 */
}

函数参数：

nfds：委托内核检测的这三个集合中最大的文件描述符 + 1
内核需要线性遍历这些集合中的文件描述符，这个值是循环结束的条件
在Window中这个参数是无效的，指定为-1即可
readfds：文件描述符的集合, 内核只检测这个集合中文件描述符对应的读缓冲区
传入传出参数，读集合一般情况下都是需要检测的，这样才知道通过哪个文件描述符接收数据
writefds：文件描述符的集合, 内核只检测这个集合中文件描述符对应的写缓冲区
传入传出参数，如果不需要使用这个参数可以指定为NULL
exceptfds：文件描述符的集合, 内核检测集合中文件描述符是否有异常状态
传入传出参数，如果不需要使用这个参数可以指定为NULL
timeout：超时时长，用来强制解除select()函数的阻塞的
NULL：函数检测不到就绪的文件描述符会一直阻塞。
等待固定时长（秒）：函数检测不到就绪的文件描述符，在指定时长之后强制解除阻塞，函数返回0
不等待：函数不会阻塞，直接将该参数对应的结构体初始化为0即可。

另外初始化fd_set类型的参数还需要使用相关的一些列操作函数，具体如下：

// 将文件描述符fd从set集合中删除 == 将fd对应的标志位设置为0        
void FD_CLR(int fd, fd_set *set);
// 判断文件描述符fd是否在set集合中 == 读一下fd对应的标志位到底是0还是1
int  FD_ISSET(int fd, fd_set *set);
// 将文件描述符fd添加到set集合中 == 将fd对应的标志位设置为1
void FD_SET(int fd, fd_set *set);
// 将set集合中, 所有文件文件描述符对应的标志位设置为0, 集合中没有添加任何文件描述符
void FD_ZERO(fd_set *set);

在这里插入图片描述

poll函数

poll的机制与select类似，与select在本质上没有多大差别，使用方法也类似，下面的是对于二者的对比：

内核对应文件描述符的检测也是以线性的方式进行轮询，根据描述符的状态进行处理
poll和select检测的文件描述符集合会在检测过程中频繁的进行用户区和内核区的拷贝，它的开销* 随着文件描述符数量的增加而线性增大，从而效率也会越来越低。
select检测的文件描述符个数上限是1024，poll没有最大文件描述符数量的限制
select可以跨平台使用，poll只能在Linux平台使用

#include <poll.h>
// 每个委托poll检测的fd都对应这样一个结构体
struct pollfd {
    int   fd;         /* 委托内核检测的文件描述符 */
    short events;     /* 委托内核检测文件描述符的什么事件 */
    short revents;    /* 文件描述符实际发生的事件 -> 传出 */
};

struct pollfd myfd[100];
int poll(struct pollfd *fds, nfds_t nfds, int timeout);

函数参数：

fds: 这是一个struct pollfd类型的数组, 里边存储了待检测的文件描述符的信息，这个数组中有三个成员：
fd：委托内核检测的文件描述符
events：委托内核检测的fd事件（输入、输出、错误），每一个事件有多个取值
revents：这是一个传出参数，数据由内核写入，存储内核检测之后的结果
nfds: 这是第一个参数数组中最后一个有效元素的下标 + 1（也可以指定参数1数组的元素总个数）
timeout: 指定poll函数的阻塞时长
-1：一直阻塞，直到检测的集合中有就绪的文件描述符（有事件产生）解除阻塞
0：不阻塞，不管检测集合中有没有已就绪的文件描述符，函数马上返回
大于0：阻塞指定的毫秒（ms）数之后，解除阻塞
函数返回值：
失败：返回-1
成功：返回一个大于0的整数，表示检测的集合中已就绪的文件描述符的总个数

epoll函数

概述

epoll 全称 eventpoll，是 linux 内核实现IO多路转接/复用（IO multiplexing）的一个实现。IO多路转接的意思是在一个操作里同时监听多个输入输出源，在其中一个或多个输入输出源可用的时候返回，然后对其的进行读写操作。epoll是select和poll的升级版，相较于这两个前辈，epoll改进了工作方式，因此它更加高效。

对于待检测集合select和poll是基于线性方式处理的，epoll是基于红黑树来管理待检测集合的。
select和poll每次都会线性扫描整个待检测集合，集合越大速度越慢，epoll使用的是回调机制，效率高，处理效率也不会随着检测集合的变大而下降
select和poll工作过程中存在内核/用户空间数据的频繁拷贝问题，在epoll中内核和用户区使用的是共享内存（基于mmap内存映射区实现），省去了不必要的内存拷贝。
程序猿需要对select和poll返回的集合进行判断才能知道哪些文件描述符是就绪的，通过epoll可以直接得到已就绪的文件描述符集合，无需再次检测
使用epoll没有最大文件描述符的限制，仅受系统中进程能打开的最大文件数目限制

当多路复用的文件数量庞大、IO流量频繁的时候，一般不太适合使用select()和poll()，这种情况下select()和poll()表现较差，推荐使用epoll()。

#include <sys/epoll.h>
// 创建epoll实例，通过一棵红黑树管理待检测集合
int epoll_create(int size);
// 管理红黑树上的文件描述符(添加、修改、删除)
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
// 检测epoll树中是否有就绪的文件描述符
int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);

select/poll低效的原因之一是将“添加/维护待检测任务”和“阻塞进程/线程”两个步骤合二为一。每次调用select都需要这两步操作，然而大多数应用场景中，需要监视的socket个数相对固定，并不需要每次都修改。epoll将这两个操作分开，先用epoll_ctl()维护等待队列，再调用epoll_wait()阻塞进程（解耦）。

epoll_create()函数的作用是创建一个红黑树模型的实例，用于管理待检测的文件描述符的集合。

int epoll_create(int size);

函数参数 size：在Linux内核2.6.8版本以后，这个参数是被忽略的，只需要指定一个大于0的数值就可以了。
函数返回值：
失败：返回-1
成功：返回一个有效的文件描述符，通过这个文件描述符就可以访问创建的epoll实例了

epoll_ctl()函数的作用是管理红黑树实例上的节点，可以进行添加、删除、修改操作。

// 联合体, 多个变量共用同一块内存        
typedef union epoll_data {
 	void        *ptr;
	int          fd;	// 通常情况下使用这个成员, 和epoll_ctl的第三个参数相同即可
	uint32_t     u32;
	uint64_t     u64;
} epoll_data_t;

struct epoll_event {
	uint32_t     events;      /* Epoll events */
	epoll_data_t data;        /* User data variable */
};
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

函数参数：

epfd：epoll_create() 函数的返回值，通过这个参数找到epoll实例
op：这是一个枚举值，控制通过该函数执行什么操作
EPOLL_CTL_ADD：往epoll模型中添加新的节点
EPOLL_CTL_MOD：修改epoll模型中已经存在的节点
EPOLL_CTL_DEL：删除epoll模型中的指定的节点
fd：文件描述符，即要添加/修改/删除的文件描述符
event：epoll事件，用来修饰第三个参数对应的文件描述符的，指定检测这个文件描述符的什么事件
events：委托epoll检测的事件
EPOLLIN：读事件, 接收数据, 检测读缓冲区，如果有数据该文件描述符就绪
EPOLLOUT：写事件, 发送数据, 检测写缓冲区，如果可写该文件描述符就绪
EPOLLERR：异常事件
data：用户数据变量，这是一个联合体类型，通常情况下使用里边的fd成员，用于存储待检测的文件描述符的值，在调用epoll_wait()函数的时候这个值会被传出。
函数返回值：
失败：返回-1
成功：返回0
epoll_wait()函数的作用是检测创建的epoll实例中有没有就绪的文件描述符。

int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);

函数参数：

epfd：epoll_create() 函数的返回值, 通过这个参数找到epoll实例
events：传出参数, 这是一个结构体数组的地址, 里边存储了已就绪的文件描述符的信息
maxevents：修饰第二个参数, 结构体数组的容量（元素个数）
timeout：如果检测的epoll实例中没有已就绪的文件描述符，该函数阻塞的时长, 单位ms 毫秒
0：函数不阻塞，不管epoll实例中有没有就绪的文件描述符，函数被调用后都直接返回
大于0：如果epoll实例中没有已就绪的文件描述符，函数阻塞对应的毫秒数再返回
-1：函数一直阻塞，直到epoll实例中有已就绪的文件描述符之后才解除阻塞
函数返回值：
成功：
等于0：函数是阻塞被强制解除了, 没有检测到满足条件的文件描述符
大于0：检测到的已就绪的文件描述符的总个数
失败：返回-1

epoll的操作步骤

创建监听的套接字

int lfd = socket(AF_INET, SOCK_STREAM, 0);

设置端口复用（可选）

int opt = 1;
setsockopt(lfd, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt));

使用本地的IP与端口和监听的套接字进行绑定

int ret = bind(lfd, (struct sockaddr*)&serv_addr, sizeof(serv_addr));

给监听的套接字设置监听

listen(lfd, 128);

创建epoll实例对象

int epfd = epoll_create(100);

将用于监听的套接字添加到epoll实例中

struct epoll_event ev;
ev.events = EPOLLIN;    // 检测lfd读读缓冲区是否有数据
ev.data.fd = lfd;
int ret = epoll_ctl(epfd, EPOLL_CTL_ADD, lfd, &ev);

检测添加到epoll实例中的文件描述符是否已就绪，并将这些已就绪的文件描述符进行处理

int num = epoll_wait(epfd, evs, size, -1);

如果是监听的文件描述符，和新客户端建立连接，将得到的文件描述符添加到epoll实例中

int cfd = accept(curfd, NULL, NULL);
ev.events = EPOLLIN;
ev.data.fd = cfd;
// 新得到的文件描述符添加到epoll模型中, 下一轮循环的时候就可以被检测了
epoll_ctl(epfd, EPOLL_CTL_ADD, cfd, &ev);

如果是通信的文件描述符，和对应的客户端通信，如果连接已断开，将该文件描述符从epoll实例中删除

int len = recv(curfd, buf, sizeof(buf), 0);
if(len == 0)
{
    // 将这个文件描述符从epoll模型中删除
    epoll_ctl(epfd, EPOLL_CTL_DEL, curfd, NULL);
    close(curfd);
}
else if(len > 0)
{
    send(curfd, buf, len, 0);
}

重复第7步的操作

epoll的工作模式

水平模式

水平模式可以简称为LT模式，LT（level triggered）是缺省的工作方式，并且同时支持block和no-block socket。在这种做法中，内核通知使用者哪些文件描述符已经就绪，之后就可以对这些已就绪的文件描述符进行IO操作了。如果我们不作任何操作，内核还是会继续通知使用者。

水平模式的特点：

读事件：如果文件描述符对应的读缓冲区还有数据，读事件就会被触发，epoll_wait()解除阻塞
当读事件被触发，epoll_wait()解除阻塞，之后就可以接收数据了
如果接收数据的buf很小，不能全部将缓冲区数据读出，那么读事件会继续被触发，直到数据被全部读出，如果接收数据的内存相对较大，读数据的效率也会相对较高（减少了读数据的次数）
因为读数据是被动的，必须要通过读事件才能知道有数据到达了，因此对于读事件的检测是必须的
写事件：如果文件描述符对应的写缓冲区可写，写事件就会被触发，epoll_wait()解除阻塞
当写事件被触发，epoll_wait()解除阻塞，之后就可以将数据写入到写缓冲区了
写事件的触发发生在写数据之前而不是之后，被写入到写缓冲区中的数据是由内核自动发送出去的
如果写缓冲区没有被写满，写事件会一直被触发
因为写数据是主动的，并且写缓冲区一般情况下都是可写的（缓冲区不满），因此对于写事件的检测不是必须的

边沿模式

边沿模式可以简称为ET模式，ET（edge-triggered）是高速工作方式，只支持no-block socket。在这种模式下，当文件描述符从未就绪变为就绪时，内核会通过epoll通知使用者。然后它会假设使用者知道文件描述符已经就绪，并且不会再为那个文件描述符发送更多的就绪通知（only once）。如果我们对这个文件描述符做IO操作，从而导致它再次变成未就绪，当这个未就绪的文件描述符再次变成就绪状态，内核会再次进行通知，并且还是只通知一次。ET模式在很大程度上减少了epoll事件被重复触发的次数，因此效率要比LT模式高。

边沿模式的特点:

读事件：当读缓冲区有新的数据进入，读事件被触发一次，没有新数据不会触发该事件
如果有新数据进入到读缓冲区，读事件被触发，epoll_wait()解除阻塞
读事件被触发，可以通过调用read()/recv()函数将缓冲区数据读出
如果数据没有被全部读走，并且没有新数据进入，读事件不会再次触发，只通知一次
如果数据被全部读走或者只读走一部分，此时有新数据进入，读事件被触发，并且只通知一次
写事件：当写缓冲区状态可写，写事件只会触发一次
如果写缓冲区被检测到可写，写事件被触发，epoll_wait()解除阻塞
写事件被触发，就可以通过调用write()/send()函数，将数据写入到写缓冲区中
写缓冲区从不满到被写满，期间写事件只会被触发一次
写缓冲区从满到不满，状态变为可写，写事件只会被触发一次
综上所述：epoll的边沿模式下 epoll_wait()检测到文件描述符有新事件才会通知，如果不是新的事件就不通知，通知的次数比水平模式少，效率比水平模式要高。

守护进程

概念

守护进程(daemon)是生存期长的一种进程。
它们常常在系统引导装入时起动，在系统关闭时终止。
所有守护进程都以超级用户(用户ID为0)的优先权运行。
守护进程没有控制终端
守护进程的父进程都是init进程

守护进程的编程步骤

使用umask将文件模式创建屏蔽字设为0
调用fork,然后让父进程退出(exit)
调用setsid创建一个新会话
将当前工作目录更改为根目录
关闭不需要的文件描述符

守护进程出错处理

由于守护进程完全脱离了控制终端，因此，不能像其他程序一样通过输出错误信息到控制台的方式来通知程序员。
通常办法是使用syslog服务，将出错信息输入到"/var/log/syslog"系统日志文件中去。
syslog是linux中的系统日志管理服务通过守护进程syslog来维护。

syslog服务说明

openlog函数用于打开系统日志服务的一个连接
syslog函数用于向日志文件中写入消息，在这里可以规定消息的优先级、消息的输出格式等。
closelog函数用于关闭系统日志服务的连接

openlog函数

#include <syslog.h>
void openlog(char * ident, int option，int facility) ;

参数

ident:要向每个消息加入的字符串通常为程序的名称。
option：
LOG_CONS
若日志消息不能通过发送至syslog，则将该消息写至控制台。
LOG_NDELAY
立即打开Linux域数据报套接口至syslsg守护进程。通常，在记录第一条消息之前，该套接口不打开。
LOG_PERROR
除将日志消息发送给syslog外，还将它写至stderr。
LOG_PID
每条消息都包含进程ID，此选择项可供对每个请求都fork一个子进程的守护进程使用。
facility:
LOG_AUTH
授权程序如login、su、getty等
LOG_CRON
cron和at
LOG_DAEMON
系统守护进程，如ftpd、routed等
LOG_KERN
内核产生的消息
LOG_LOCALO～7
保留由本地使用
LOG_LPR
行打系统，如lpd、lpc等
LOG_MAIL
邮件系统
LOG_NEwSu
senet网络新闻系统
LOG_sYSLOG
syslog守护进程本身
LOG_USER
来自其他用户进程的消息
LOG_UUCP
UUCP系统

syslog函数和closelog函数

#include <syslog.h>
void syslog(int priority , char *format,...);
void closelog(void);

参数
priority:消息优先级
LOG_EMERG
紧急(系统不可使用，最高优先级)
LOG_ALERT
必须立即修复的条件
LOG_CRIT
临界条件(例如，硬设备出错)
LOG_ERR
出错条件
LOG_WARNING
警告条件
LOG_NOTICE
正常，但重要的条件
LOG_INFO
信息性消息
LOG_DEBUG
调试排错消息(最低优先级)