//一:listen()队列剖析
//listen():监听端口,用在 TCP连接 中的 服务器端 角色;客户端不能用,udp不能用
//listen()函数调用格式:
//int listen(int sockfd, int backlog);
//要理解好backlog这个参数,我们需要先谈一谈 “监听套接字 队列”的话题;
//(1.1)监听套接字的队列
//对于一个调用listen()进行监听的套接字,操作系统会给这个套接字 维护两个队列;
//a)未完成连接队列 【保存连接用的】
//客户端connect一调用,开始三次握手第一次
//当客户端 发送tcp连接三次握手的第一次【syn包】给服务器的时候,服务器就会在未完成队列中创建一个 跟这个 syn包对应的一项,
//其实,我们可以把这项看成是一个半连接【因为连接还没建立起来呢】,这个半连接的状态会从LISTEN变成SYN_RCVD状态,同时给客户端返回第二次握手包【syn,ack】
//这个时候,其实服务器是在等待完成第三次握手;
//b)已完成连接队列 【保存连接用的】
//当第三次握手完成了,这个连接就变成了ESTABLISHED状态,每个已经完成三次握手的客户端 都放在这个队列中作为一项;(完成了之后将客户端从未完成队列拉到已完成队列)
//backlog曾经的含义:已完成队列和未完成队列里边条目之和 不能超过 backlog;超过的话,第三次连接进不来了
//(1)客户端这个connect()什么时候返回,其实是收到三次握手的第二次握手包(也就是收到服务器发回来的syn/ack)之后就返回了;
//(2)RTT是未完成队列中任意一项在未完成队列中留存的时间,这个时间取决于客户端和服务器;
//对于客户端,这个RTT时间是第一次和第二次握手加起来的时间;
//对于服务器,这个RTT时间实际上是第二次和第三次握手加起来的时间;-------也就是syn,ack一来一回的时间。
//如果这三次握手包传递速度特别快的话,大概187毫秒能够建立起来这个连接;这个时间挺慢,所以感觉建立TCP连接的成本挺高;【短连接游戏-挺恶心的】
//(3)如果一个恶意客户,迟迟不发送三次握手的第三个包。那么这个连接就建立不起来,那么这个处于SYN_RCVD的这一项【服务器端的未完成队列中】,
//就会一致停留在服务器的未完成队列中,这个停留时间大概是75秒,如果超过这个时间,这一项会被操作系统干掉;
//(1.2)accept()函数
//accept()函数,就使用来 从 已完成连接队列 中 的队首【队头】位置取出来一项【每一项都是一个已经完成三路握手的TCP连接】,返回给进程,socket;
//如果已完成连接队列是空的呢?那么咱们这个范例中accept()会一致卡在这里【休眠】等待,把自己的时间片分给其他进程,一直到已完成队列中有一项时才会被唤醒;
//所以,从编程角度,我们要尽快的用accept()把已完成队列中的数据【TCP连接】取走,大家必须有这个认识;
//accept()返回的是个套接字,这个套接字就代表那个已经用三次握手之后建立起来的那个tcp连接,因为accept()是从 已完成队列中取的数据;
//队列中存的实际上是套接字,每个套接字对应一个tcp连接
//换句话来说,我们服务器程序,必须要严格区分两个套接字:
//a)监听9000端口这个套接字,这个东西叫“监听套接字【listenfd】”,只要服务器程序在运行,这个套接字就应该一直存在;
//b)当客户端连接进来,操作系统会为每个成功建立三次握手的客端再创建一个套接字【当然是一个已经连接套接字】,accept()返回的就是这种套接字;
//也就是从已完成连接队列中取得的一项。随后,服务器使用这个accept()返回的套接字(connfd )和客户端通信的;
//实际上三次握手第一次syn来的时候,这个套接字就已经存在了,只不过三次握手成功了之后,这才是一个能用的套接字
//思考题:
//(1)如果两个队列之和【已完成连接队列,和未完成连接队列】达到了listen()所指定的第二参数,也就是说队列满了;
//此时,再有一个客户发送syn请求,服务器怎么反应?
//实际上服务器会忽略这个syn,不给回应; 客户端这边,发现syn没回应,过一会会重发syn包;
//(2)从连接被扔到已经完成队列中去,到accept()从已完成队列中把这个连接取出这个之间是有个时间差的,如果还没等accept()从
//已完成队列中把这个连接取走的时候,客户端如果发送来数据,这个数据就会被保存再已经连接的套接字的接收缓冲区里,这个缓冲区有多大,
//最大就能接收多少数据量; 之后read就能从这个缓冲区read数据了
//(1.3)syn攻击【syn flood】:典型的利用TCP/IP协议涉及弱点进行坑爹的一种行为;
//黑客只发一个syn包,不发三次握手的第三次包(ack);因为地址是伪造的,那么服务器返回的ack包送不到真实地址。那么服务器就会在未完成连接的队列里建立条目数
//如果两队列之和超过backlog,也就是服务器满了,那么服务器就会忽略掉syn包,拒绝服务了,那么有正常连接的syn包来了,就不会被处理了,后续合法的用户就上不来了
//拒绝服务攻击(DOS/DDOS);
//backlog(有操作系统的默认最大值):进一步明确和规定了:指定给定套接字上内核为之排队的最大已完成连接数【已完成连接队列中最大条目数】;
//也就是backlog指定为已完成连接队列中最大条目数,而不包括未完成的连接队列的条目数
//大家在写代码时尽快用accept()把已完成队列里边的连接取走,尽快 留出空闲为止给后续的已完成三路握手的条目用,那么这个已完成队列一般不会满;
//一般这个backlog值给300左右;
//二:阻塞与非阻塞I/O
//阻塞和非阻塞主要是指调用某个系统函数时,这个函数是否会导致我们的进程进入sleep()【卡在这休眠】状态而言的;
//a)阻塞I/O
//我调用一个函数,这个函数就卡在在这里,整个程序流程不往下走了【休眠sleep】,该函数卡在这里等待一个事情发生,只有这个事情发生了,这个函数才会往下走;
//这种函数,就认为是阻塞函数;accept();-----三次握手成功,则返回,不阻塞了
//accept:可以是阻塞的,也可以是非阻塞的,取决于参数
//这种阻塞,并不好,效率很低;一般我们不会用阻塞方式来写服务器程序,效率低;
//操作系统给每个进程分时间片,你一阻塞就把自己时间片送给别人了,你有100ms,只用了10ms,90ms给别人了,别人就多了
//b)非阻塞I/O:不会卡住,充分利用时间片,执行更高;
//非阻塞模式的两个鲜明特点:
//(1)不断的调用accept(),recvfrom()函数来检查有没有数据到来,如果没有,函数会返回一个特殊的错误标记来告诉你,这种标记可能是EWULDBLOCK,
//也可能是EAGAIN;如果数据没到来,那么这里有机会执行其他函数,但是也得不停的再次调用accept(),recvfrom()来检查数据是否到来,非常累;
//(2)如果数据到来,那么就得卡在这里把数据从内核缓冲区复制到用户缓冲区,所以复制这个阶段是卡着完成的;
//三:同步与异步I/O:这两个概念容易和 阻塞/非阻塞混淆;
//a)异步I/O:调用一个异步I/O函数时,我门要给这个函数指定一个接收缓冲区,我还要给定一个回调函数;----回调函数一调用,就表示来数据了,可以用了
//调用完一个异步I/O函数后,该函数会立即返回。 其余判断交给操作系统,操作系统会判断数据是否到来,如果数据到来了,操作系统会把数据
//拷贝到你所提供的缓冲区里,然后调用你所指定的这个回调函数来通知你;
//很容易区别非阻塞和异步I/O的差别:
//(1)非阻塞I/O要不停的调用I/O函数来检查数据是否来,如果数据来了,就得卡在I/O函数这里把数据从内核缓冲区复制到用户缓冲区,然后这个函数才能返回;
//(2)异步I/O根本不需要不停的调用I/O函数来检查数据是否到来,只需要调用一次,然后就可以干别的事情去了;
//内核判断数据到来,拷贝数据到你提供的缓冲区,调用你的回调函数来通知你,你并没有被卡在那里的情况;
//b)同步I/O
//select/poll。epoll。
//1)调用select()判断有没有数据,有数据,走下来,没数据卡在那里;
//2)select()返回之后,用recvfrom()去取数据;当然取数据的时候也会卡那么一下;
//同步I/O感觉更麻烦,要调用两个函数才能把数据拿到手;
//但是同步I/O和阻塞式I/O比,就是所谓的 I/O复用【用两个函数来收数据的优势】 能力;
//(3.1)I / O复用
//所谓I/O复用,就是我多个socket【多个TCP连接】可以弄成一捆【一堆】,我可以用select这种同步I/O函数在这等数据;
//select()的能力是等多条TCP连接上的任意一条有数据来;,然后哪条TCP有数据来,我再用具体的比如recvfrom()去收。
//所以,这种调用一个函数能够判断一堆TCP连接是否来数据的这种能力,叫I/O复用,英文I/O multiplexing【I/O多路复用】
//很多资料把 阻塞I/O,非阻塞I/O,同步I/O归结为一类 ,因为他们多多少少的都有阻塞的行为发生;
//甚至有的资料直接就把 阻塞I/O,非阻塞I/O 都归结为同步I/O模型,这也是可以的】
//而把异步I/O单独归结为一类,因为异步I/O是真正的没有阻塞行为发生的;
//(3.2)思考题
//什么叫 用 异步的方法 去使用 非阻塞调用 ?