linux句柄分配,Linux和Windows下Socket句柄(描述符)的分配策略

烽驿2009开源实时通信平台 源码获取:svn checkout http://fy2009.googlecode.com/svn/trunk/ fy2009-read-only

大型通信服务器软件通常需要管理成千上万的连接,为了在底层Socket句柄(Linux上称为描述符)上收到

数据时能快速递交给应用层连接对象,实现一种高效的以Socket句柄为Key的连接对象查找算法是绝对必要的。毫无疑问,最快的查找算法是直

接以Socket句柄为下标的连接对象数组,但该算法要求操作系统在分配Socket句柄时高度聚集,否则,将

引起对象数组的“稀疏化”,影响系统容量,甚至引起内存耗尽;退而求其次的算法应当是具有实用恰当的Hash函数的Hash Table,其优点是

允许操作系统在分配Socket句柄时相对离散,但算法效率不如上述数组下标法; 再退而求其次,STL标准

map的红-黑树也是一种选择,但在该场景,其插入和查找效率都不太理想。但究竟采用哪种算法,很大程

度上取决于操作系统分配Socket句柄的策略。笔者分别对Linux和Windows做了测试,结论如下:

Linux:

无论2.4还是2.6内核,其Socket描述符分配都是从3开始,连续递增。因为在Linux下,Socket描述符其实

就是文件描述符,和硬盘文件及其它IO设备共享取值空间,因为0,1,2分别预留给了标准输入,标准输出和

标准错误,因此Socket描述符最小从3开始,若程序在访问Socket的同时还会访问磁盘文件或其它IO设备,

将会用掉一部分文件描述符,导致Socket描述符不再连续,但所有打开的IO设备描述符加在一起,则严格

表现为连续递增。

结论:Linux下Socket描述符分配表现为高度聚集,因此,要在Linux下实现以Socket描述符为Key的连接对

象查找算法,数组下标法是当然的首选。

Windows XP:

前面的484个句柄从1952开始按4递减(如果是64位系统也许会按8递减,但仅是猜测,没有实证),其

中,644,568,536和268四个句柄跳空(不确定是否和标准输入,标准输出等有关),0被保留不用。从第485

个句柄开始,则从2052开始按4递增(2052和1952之间空100或25个句柄)。同样,打开磁盘文件也会挤占

掉Socket句柄取值。

结论:Windows下Socket句柄分配策略同样表现出聚集特性,也和磁盘文件等共享取值空间,但和Linux不

同的是,Windows下Socket句柄并不连续,而是按4递增或递减,另外,也不是单调递增,刚开始时从1952

开始递减。

结论:Windows下Socket句柄描述符分配同样表现出聚集特性,在基于Socket句柄查找连接对象时同样可以

采用数组下标法,但为了避免数组过于稀疏,最好对句柄值除以4,另外,数组尺寸则不能小于1952/4。

上述算法的缺陷是操作系统并未承诺上述分配策略不变,操作系统升级导致的分配策略变化可能引起查找

算法失效,但对于效率至关重要的Server应用,仍然值得采用,尽量通过较好的程序结构规划,以降低操

作系统升级可能引起的程序变更。而对于操作系统兼容性更重要,可适当牺牲情能的客户端应用也可考虑采用Hash Table或标准Map等查找连接对象

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Select在Socket编程中还是比较重要的,可是对于初学Socket的人来说都不太爱用Select写程序,他们只是习惯写诸如connect、accept、recv或recvfrom这样的阻塞程序(所谓阻塞方式block,顾名思义,就是进程或是线程执行到这些函数时必须等待某个事件的发生,如果事件没有发生,进程或线程就被阻塞,函数不能立即返回)。可是使用Select就可以完成非阻塞(所谓非阻塞方式non-block,就是进程或线程执行此函数时不必非要等待事件的发生,一旦执行肯定返回,以返回值的不同来反映函数的执行情况,如果事件发生则与阻塞方式相同,若事件没有发生则返回一个代码来告知事件未发生,而进程或线程继续执行,所以效率较高)方式工作的程序,它能够监视我们需要监视的文件描述符的变化情况——读写或是异常。下面详细介绍一下! Select的函数格式(我所说的是Unix系统下的伯克利socket编程,和windows下的有区别,一会儿说明): int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout); 先说明两个结构体: 第一,struct fd_set可以理解为一个集合,这个集合中存放的是文件描述符(file descriptor),即文件句柄,这可以是我们所说的普通意义的文件,当然Unix下任何设备、管道、FIFO等都是文件形式,全部包括在内,所以毫无疑问一个socket就是一个文件,socket句柄就是一个文件描述符。fd_set集合可以通过一些宏由人为来操作,比如清空集合FD_ZERO(fd_set *),将一个给定的文件描述符加入集合之中FD_SET(int ,fd_set *),将一个给定的文件描述符从集合中删除FD_CLR(int ,fd_set*),检查集合中指定的文件描述符是否可以读写FD_ISSET(int ,fd_set* )。一会儿举例说明。 第二,struct timeval是一个大家常用的结构,用来代表时间值,有两个成员,一个是秒数,另一个是毫秒数。 具体解释select的参数: int maxfdp是一个整数值,是指集合中所有文件描述符的范围,即所有文件描述符的最大值加1,不能错!在Windows中这个参数的值无所谓,可以设置不正确。 fd_set *readfds是指向fd_set结构的指针,这个集合中应该包括文件描述符,我们是要监视这些文件描述符的读变化的,即我们关心是否可以从这些文件中读取数据了,如果这个集合中有一个文件可读,select就会返回一个大于0的值,表示有文件可读,如果没有可读的文件,则根据timeout参数再判断是否超时,若超出timeout的时间,select返回0,若发生错误返回负值。可以传入NULL值,表示不关心任何文件的读变化。 fd_set *writefds是指向fd_set结构的指针,这个集合中应该包括文件描述符,我们是要监视这些文件描述符的写变化的,即我们关心是否可以向这些文件中写入数据了,如果这个集合中有一个文件可写,select就会返回一个大于0的值,表示有文件可写,如果没有可写的文件,则根据timeout参数再判断是否超时,若超出timeout的时间,select返回0,若发生错误返回负值。可以传入NULL值,表示不关心任何文件的写变化。 fd_set *errorfds同上面两个参数的意图,用来监视文件错误异常。 struct timeval* timeout是select的超时时间,这个参数至关重要,它可以使select处于三种状态,第一,若将NULL以形参传入,即不传入时间结构,就是将select置于阻塞状态,一定等到监视文件描述符集合中某个文件描述符发生变化为止;第二,若将时间值设为0秒0毫秒,就变成一个纯粹的非阻塞函数,不管文件描述符是否有变化,都立刻返回继续执行,文件无变化返回0,有变化返回一个正值;第三,timeout的值大于0,这就是等待的超时时间,即select在timeout时间内阻塞,超时时间之内有事件到来就返回了,否则在超时后不管怎样一定返回,返回值同上述。 返回值: 负值:select错误 正值:某些文件可读写或出错 0:等待超时,没有可读写或错误的文件

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值