socket编程1

向多个客户端提供服务是一种有效利用cpu的方式,讨论向多个客户端提供服务的并发服务器端。
具有代表性的并发服务器端实现模型和方法:
多进程服务器端:通过创建多个进程提供服务。
多路复用服务器:通过捆绑并统一管理I/O对象提供服务。
多线程服务器:通过生成与客户端等量的线程提供服务。

进程的定义:占用内存空间的正在运行的程序。
进程—》进程ID。在linux系统下, 进程ID一般为大于2的整数,1要分配给操作系统启动后的(用于协作操作系统)首个进程。 ps命令可以查看linux下正在运行的进程

创建进程的方法很多,此处只介绍用于创建多进程服务器端的fork函数。

fork函数将创建调用的进程副本。即,进程的创建并不是根据完全不同的程序创建的,而是复制正在运行的、调用fork函数的进程。两个进程(调用前以及调用fork后复制的进程)都将执行fork函数调用后的语句(准确的说是在fork函数返回后)。但因为同一个进程、复制相同的内存空间,之后的程序流要根据fork函数的返回值加以区分。
即利用fork函数的如下特点区分程序执行流程。
父进程:fork函数返回子进程ID.
子进程:fork函数返回0.
父进程是指原进程,即调用fork函数的主体,而“子进程”是通过父进程调用fork函数复制出的进程。

从上图可知,父进程调用fork函数的同时复制出子进程,并分别得到fork函数的返回值。但复制前,父进程将全局变量gval增加到11,将局部变量lval增加到25,在这种状态下完成进程复制。复制完成后根据fork函数的返回类型区分复制进程。父进程将lval的值加1,但这并不会影响子进程的lval值。同样,子进程将gval的值加1也不会影响父进程的gval。因为fork函数调用后分成了完全不同的进程,只是二者共享了同一代码而已。

调用fork函数后,父子进程拥有完全独立的内存结构。
文件操作中,关闭文件和打开文件同等重要,同样,进程销毁和进程创建同等重要。如果没有认真对待进程销毁,那么部分进程会变为僵尸进程来打扰各位。
僵尸进程:进程完成工作后应该被销毁,但有时这些进程将变成僵尸进程,占用系统中的重要资源。这种状态下的进程称作僵尸进程。
如下两个实例展示调用fork函数产生子进程的终止方式:
传递参数并调用exit函数。
main函数中执行return语句并返回值。
向exit函数传递的参数值和main函数的return语句返回的值都会传递给操作系统。而操作系统不会销毁子进程,直到把这些值传递给产生孩子进程的父进程。处在这种状态下的进程就是僵尸进程。也就是说,将子进程编程僵尸进程的正是操作系统。
僵尸进程该何时销毁呢?应该向创建子进程的父进程传递子进程的exit参数值或return语句的返回值。
如何向父进程传递这些值呢?操作系统不会主动把这些值传递给父进程。只有父进程主动发起请求(函数调用)时,操作系统才会传递该值。如果父进程未主动要求获得子进程的结束状态值,操作系统将一直保存,并让子进程长时间处于僵尸进程状态。也就是说,父进程要负责回收将自己fork出的子进程。

销毁僵尸进程的方法
如前所述,为了销毁子进程,父进程应该主动请求获取子进程的返回值。
方法1调用wait函数:

调用此函数如果已有子进程终止,那么子进程终止时传递的返回值(exit函数的参数值、main函数的return返回值)将保存到该函数的参数所指内存空间。但函数参数指向的单元中还包含其他信息,因此需要通过下列宏进行分离:WIFEXITED子进程正常终止时返回“真”(true)。
WEXITSTATUS返回子进程的返回值。
也就是说,向wait函数传递变量status的地址时,调用wait函数后应编写如下代码:

通过调用wait函数消灭僵尸进程的方法,调用wait函数时,如果没有已终止的子进程,那么程序将阻塞知道直到有子进程终止。因此需谨慎调用该函数。

销毁僵尸进程2:使用waitpid函数:
wait函数会引起程序阻塞,还可以考虑调用waitpid函数。这是防止僵尸进程的第二种方法。

调用waitpaid函数时,程序不会阻塞。

信号处理:子进程终止的识别主体是操作系统,因此,若操作系统能把子进程终止的信息告诉正在工作的父进程,这将有助于构建高效的程序。为了实现该想法,我们引入信号处理机制。此处的信号是在特定事件发生时由操作系统向进程发送的消息。另外,为了响应该消息,执行与消息相关的自定义操作的过程称为“处理”或“信号处理”。

这个讲话所讲的相当于“注册信号”过程,即进程法线自己的子进程结束时,请求操作系统调用特定函数。该请求通过如下函数调用完成(因此称此函数为信号注册函数):

利用sigaction函数进行信号处理,sigaction类似于signal函数,而且可以完全代替signal.

基于进程的并发服务型模型:之前的回声服务器端每次只能向1个客户端提供服务,因此,将扩展回声服务器端,是其可以同时向多个客户端提供服务。

从上图可以看出,每当有客户端请求服务(连接请求)时,回声服务器端都创建子进程以提供服务。请求服务的客户端若有5个,则将创建5个子进程提供服务。为了完成这些任务,需要经过如下过程,这是与之前的回声服务器端的区别所在:
第一阶段:回声服务器端(父进程)通过调用accept函数受理连接请求。
第二阶段:此时获取的套接字文件描述符创建并传递给子进程。
第三阶段:子进程利用传递过来的文件描述符提供服务。

通过fork函数复制文件描述符:父进程将2个套接字(一个是服务器端套接字,一个是与客户端连接的套接字)文件描述符复制给子进程。调用fork函数时复制子进程的所有资源,但不包括套接字。
因为套接字并不是进程所有(类似于文件),复制的只是一个指向套接字的文件描述符。
类似于文件,调用fork子进程的时候,不会复制出来一份文件,只是复制出来一份指向文件的描述符,关于套接字的也是同样的道理。
所以调用fork函数之后,会有多个文件描述符指向同一套接字。

所以当1个套接字中存在2个文件描述符时,只有2个文件描述符都终止(销毁)后,才能销毁套接字。
如果维持图中的连接状态,即使子进程销毁了与客户端连接的套接字文件描述符,也无法完全销毁套接字,(因为子进程的被销毁,而父进程指向套接字的文件描述符还依然存在,所以套接字不能被完全销毁。)。所以,在调用fork函数后,要将无关的套接字文件描述符关掉。

在客户端中分割I/O程序:之前编写的客户端,传输数据之后需要等待服务端返回的数据,只能这么写的原因在于,程序在1个进程中运行,但现在可以创建多个进程,因此可以分割数据的收发过程。
可以编写为客户端的父进程负责接收数据,额外创建的子进程负责发送数据,分割后,不同进程分别负责输入和输出。所以,当客户端是否从服务端接收完数据都可以进行传输。

将I/O分开的好处是程序实现简单,按照多进程的实现方式,父进程中只需编写接收数据的代码,子进程中只需编写发送数据的代码,所以会简化。
而在1个进程中同时实现数据收发逻辑需要考虑更多的细节。程序会更复杂。
而分割I/O程序的另一个好处是,可以提高频繁交换数据的程序性能。

进程间的通信:意味着两个不同的进程间可以交换数据,为了完成这一点,操作系统中提供的两个进程应该可以同时访问内存空间。

只要有两个进程可以同时访问的内存空间,就可以通过此空间来交换数据,但进程具有完全独立的内存结构,就连fork函数创建的子进程也不会与父进程共享内存空间,所以,进程间的通信只能通过特殊方法来完成。

所以就通过创建管道来实现进程间的通信,为了完成进程间通信,需要创建管道,管道并不是进程的资源,而是和套接字一样,属于操作系统(并不是fork函数可以进行复制的对象)。
两个进程通过操作提供的内存空间来进行通信(管道)。

以长度为2的int数组地址值作为参数调用上述函数时,数组中存有两个文件描述符,它们将被用作管道的出口和入口。父进程调用该函数时将创建管道,同时获取对应于出入口的文件描述符。此时,父进程可以读写同一管道。但父进程的目的是与子进程进行数据交换,因此 需要将入口或出口的1个文件描述符传递给子进程。------------->通过调用fork函数来传递管道入口或出口。

通过fork函数可以在上一章遇到的情况一样,复制指向管道的文件描述符,然后通过复制的指向管道的文件描述符来共享管道,即,父子进程可以同时拥有I/O文件描述符。

父子进程都可以访问管道的I/O路径,但子进程仅用于输入路径,父进程仅用输出路径。

还可以通过管道进行进程间的双向通信:

通过一个管道来进行双向通信,很容易发生错误,因为数据在进入管道之后成为无主数据,也就是通过read函数先从管道中读取的数据的进程将得到数据,即使是该进程将数据传到管道中的。
所以只用一个管道来进行双向通信并非易事,所以双向通信最后通过创建2个管道来完成,创建的2个管道各自负责不同的数据流动即可。

基于I/O复用的服务器端:为了构建并发服务器,只要有客户端连接请求就会创建新进程,这的确是实际操作中采用的一种方案,但是创建进程时需要付出极大的代价,由于每个进程都具有独立的内存空间,所以进程间相互的数据交换也要采用相对复杂的方法(IPC)。

所以可以采用I/O复用在不创建进程的同时向多个客户端提供服务。

在服务器端引入复用技术可以减少所需进程数。

I/O复用与多进程之间的对比:引入复用技术,可以减少进程数。无论连接多少客户端,提供服务的进程都只有一个。

利用select函数并实现服务器端:运用select函数时最具有代表性的实现复用服务器端方法。Windows平台下也有同名函数的功能,所以具有良好的移植性。

select函数的功能和调用顺序:使用select函数时可以将多个文件描述符集中到一起统一监视。
项目如下:
是否存在套接字接收数据?
无需阻塞传输数据的套接字有哪些?
哪些套接字发生了异常?

select函数的使用方法与一般函数区别较大,为了实现I/O复用,必须要掌握select函数,并运用到套接字编程中。
select函数的调用方法和顺序:

调用select函数到获取结果所经过程,可知,调用select函数前需要一些准备工作,调用后还需查看结果。
准备工作:
设置文件描述符:利用select函数可以同时监视多个文件描述符,当然,监视文件描述符可以视为监视套接字。此时首先需要将监视的文件描述符集中到一起。集中时也要按照监视项(接收、传输、异常)进行区分,即按照上述3中监视项分层3类。使用fd_set数组变量执行此操作。该数组是存有0和1的位数组。

最左端的位表示文件描述符0(所在位置)。如果该位设置为1,则表示该文件描述符是监视对象。
很明显,图中的文件符述符1和3是监事对象。

fd_set变量的操作是以位为单位进行的。所以,在fd_set变量中注册或更改值的操作都是由下列宏完成的。

下面简单介绍下select函数:

select函数用来验证3中监视项的变化情况,根据监视项声明3个fd_set型变量,分别向其注册文件描述符信息,并把变量的地址值传递到上述函数的第二到第四个参数。但在此之前(调用select函数前)需要决定下面2件事:
文件描述符的监视(检查)范围时?
如何设定select函数的超时时间?
第一,文件描述符的监视范围与select函数的第一个参数有关。实际上,select函数要求通过第一个参数传递监视对象文件描述符的数量。因此,需要得到注册在fd_set变量中的文件描述符数。但每次新建文件描述符时,其值都会加1,故只需要将最大的文件描述符值加1在传递到select函数即可。加1是因为文件描述符的值从0开始。 第一个参数传递最大的文件描述符+1。

第二,select函数的超时时间与select函数的最后一个参数有关,其中timeval结构体定义如下:
struct timeval{
long tv_sec; //seconds
long tv_usec; //microseconds
}
本来select函数只有在监视的文件描述符发生变化时才返回。如果未发生变化,就会进入阻塞状态。指定超时时间就是为了防止这种情况发生。
通过将上述结构体传入select函数,即使文件描述符未发生变化,只要过了指定时间,也可以从函数中返回,不过在这种情况下,select函数返回0。所以可以通过返回值了解返回原因。

调用select函数后查看结果:
select函数的返回值,如果返回大于0的整数,说明相应数量的文件描述符发生变化。

select函数返回正整数是,如何知道哪些文件描述符发生变化?
select函数调用完成后,向其传递的fd_set变量中将发生变化,原来为1的所有为均变为0,但发生变化的文件描述符对应除外。
所以可以认为调用select之后,fd_set中值仍为1文件描述符发生了变化。

通过FD_SET来设置要监视的文件标识符。

在调用select时,将fd_max+1,传递给函数。

在Windows下平台调用select函数:Windows同样提供select函数,而且所有的参数与Linux下的Select函数完全相同。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值